2025高考数学新一卷AI对决:豆包、元宝68分并列榜首,OpenAI o3仅34分垫底

[复制链接]
周大 发表于 8 小时前 | 显示全部楼层 |阅读模式
今年高考数学因难度高引发广泛讨论,多家大模型参与了一场特殊的“高考数学竞赛”。测试采用 2025 年数学新课标Ⅰ卷的 14 道客观题,总分 73 分。结果显示,字节的豆包和腾讯的元宝以 68 分并列第一,DeepSeek 和通义紧随其后,而 OpenAI 的 o3 表现不佳仅得 34 分,被认为“水土不服”。相比去年,大模型在数学推理上进步明显,新增了反思能力和更详细的推理步骤,但仍存在计算细节错误、几何理解不足等问题。此次评测不仅展示了大模型的能力提升,也暴露了其在复杂逻辑推理中的短板,未来仍有改进空间。
来源:https://tech.ifeng.com/c/8k0czaGH8dZ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 23:43 , Processed in 0.275881 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表