永别了,人类冠军!AI横扫天文奥赛,GPT-5得分远超金牌选手2.7倍

[复制链接]
周大 发表于 2025-10-12 16:03:19 | 显示全部楼层 |阅读模式
一项由俄亥俄州立大学进行的研究显示,在国际天文与天体物理奥赛(IOAA)测试中,GPT-5和Gemini 2.5 Pro在理论考试中分别取得84.2%和85.6%的平均分,在数据分析中GPT-5更达88.5%,均达到金牌水平,整体表现媲美甚至超越人类顶尖选手,相当于人类金牌得主水平的2.7倍。研究评估了五款主流大模型在2022–2025年IOAA试题上的表现,发现AI在物理与数学类问题上表现优异,但在涉及空间可视化的几何题上显著落后,暴露出在球面三角学、时间系统理解及三维推理方面的系统性弱点。错误分析表明,概念性和空间推理错误占主导,而计算能力较强。尽管GPT-5凭借多模态优势在数据分析中领先,所有模型在图表解读和绘图任务中仍面临挑战。该研究表明,当前LLM已具备解决复杂科学问题的能力,但在深度物理理解与多模态推理方面仍有提升空间,需开发更生态化的评估基准推动发展。
来源:https://mp.weixin.qq.com/s/QJof2TJQ2a5N_kCB-07y3Q

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 18:01 , Processed in 0.274830 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表