o4-mini暴击六大数学天团攻破陶哲轩难题!4.5h激战人类阵地失守

[复制链接]
周大 发表于 2025-5-29 13:37:15 | 显示全部楼层 |阅读模式
近期,Epoch AI组织了一场名为FrontierMath的竞赛,旨在评估AI在数学领域的潜力。比赛中,AI模型o4-mini-medium与40位数学精英组成的8支团队展开对决,解决23道高难度数学题。结果显示,o4-mini-medium解决了约22%的题目,超越了人类平均水平(19%),并击败6支人类团队。尽管如此,综合所有人类团队表现后,人类整体得分达到约35%,略高于AI。研究人员强调,比赛时间限制及题目难度分布可能影响结果准确性。此外,AI虽在知识广度上占优,但其推理能力是否真正掌握数学原理仍需进一步探索。Epoch AI预测,未来两年内AI有望在数学领域取得重大突破,全面超越人类水平指日可待。
来源:https://tech.ifeng.com/c/8jifvSqSdYW

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 02:17 , Processed in 0.300313 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表