质疑DeepSeek-R1、Claude Thinking根本不会推理!苹果争议论文翻车了?

[复制链接]
周大 发表于 昨天 13:52 | 显示全部楼层 |阅读模式
苹果团队发布论文质疑当前大语言模型(LLM)的推理能力,指出DeepSeek-R1、o3-mini等模型可能仅擅长记忆模式而非真正推理。研究通过可控谜题环境替代传统数学基准测试,揭示推理模型在不同复杂度下的表现:低复杂度时非推理模型更优,中等复杂度时推理模型占优,高复杂度时两者均崩溃。此外,研究发现推理模型存在根本性局限,包括减少推理投入及“过度思考”现象。然而,这一结论引发争议,部分研究者认为模型性能受限于输出token数量而非推理能力,若此观点成立,则苹果的研究意义可能受到质疑。
来源:https://mp.weixin.qq.com/s/Kc6QdjOdfqTlxQpW68UMdA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-10 13:43 , Processed in 0.273730 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表