苹果《思考的错觉》再挨批,Claude与人类共著论文指出其三大关键缺陷

[复制链接]
周大 发表于 昨天 14:41 | 显示全部楼层 |阅读模式
苹果一篇论文质疑大型推理模型的泛化能力,但其研究方法引发争议。Anthropic和Open Philanthropy发表评论论文,指出苹果研究存在实验设计缺陷,如忽视模型token限制、错误评估模型能力及包含无解实例等问题。同时,这篇由AI与人类合著的论文建议改进评估方法以更好区分推理与文本生成能力,引发学界关注与讨论。
来源:https://mp.weixin.qq.com/s/hK8ruewbC-LR4vwHnJh4Pg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-15 19:16 , Processed in 0.263615 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表