GPT-5.2性能爆表，但红色警报没有解除

周大发表于 4 天前

OpenAI发布GPT-5.2，在数学推理（AIME满分）、专业任务（70.9%超越人类专家）、代码能力（SWE-Bench最高80%准确率）及长文本理解（256k token近100%准确）等方面显著提升，并实现ARC-AGI-1测试中90.5%准确率且单任务成本降至11.64美元，效率提升约390倍。但其在《纽约时报》Connections语言联想测试中仅获77.9%准确率，排名靠后，暴露语义理解短板。与此同时，API价格全面上调，GPT-5.2 Pro输出单价达168美元/百万token，远高于降价中的Claude和Gemini，反映出OpenAI正以“AI奢侈品”策略构建高端壁垒，但在技术未全面领先的背景下，该高风险路径面临市场接受度与可持续性的严峻考验。
来源：https://tech.ifeng.com/c/8p1B6geBoPl

		自动登录	找回密码
密码			立即注册

课程导航

GPT-5.2性能爆表，但红色警报没有解除