o4-mini暴击六大数学天团攻破陶哲轩难题！4.5h激战人类阵地失守

周大发表于 2025-5-29 13:37:15

近期，Epoch AI组织了一场名为FrontierMath的竞赛，旨在评估AI在数学领域的潜力。比赛中，AI模型o4-mini-medium与40位数学精英组成的8支团队展开对决，解决23道高难度数学题。结果显示，o4-mini-medium解决了约22%的题目，超越了人类平均水平（19%），并击败6支人类团队。尽管如此，综合所有人类团队表现后，人类整体得分达到约35%，略高于AI。研究人员强调，比赛时间限制及题目难度分布可能影响结果准确性。此外，AI虽在知识广度上占优，但其推理能力是否真正掌握数学原理仍需进一步探索。Epoch AI预测，未来两年内AI有望在数学领域取得重大突破，全面超越人类水平指日可待。
来源：https://tech.ifeng.com/c/8jifvSqSdYW

		自动登录	找回密码
密码			立即注册

课程导航

o4-mini暴击六大数学天团攻破陶哲轩难题！4.5h激战人类阵地失守