GPT-5.2性能爆表,但红色警报没有解除

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
OpenAI发布GPT-5.2,在数学推理(AIME满分)、专业任务(70.9%超越人类专家)、代码能力(SWE-Bench最高80%准确率)及长文本理解(256k token近100%准确)等方面显著提升,并实现ARC-AGI-1测试中90.5%准确率且单任务成本降至11.64美元,效率提升约390倍。但其在《纽约时报》Connections语言联想测试中仅获77.9%准确率,排名靠后,暴露语义理解短板。与此同时,API价格全面上调,GPT-5.2 Pro输出单价达168美元/百万token,远高于降价中的Claude和Gemini,反映出OpenAI正以“AI奢侈品”策略构建高端壁垒,但在技术未全面领先的背景下,该高风险路径面临市场接受度与可持续性的严峻考验。
来源:https://tech.ifeng.com/c/8p1B6geBoPl

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-16 02:36 , Processed in 0.256485 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表