苹果研究揭示大推理模型在高复杂度任务中易崩溃,Bengio兄弟合著论文揭AI推理局限

[复制链接]
周大 发表于 前天 13:55 | 显示全部楼层 |阅读模式
苹果的一项新研究表明,大推理模型(LRM)在面对高复杂度任务时会出现“推理崩溃”。研究通过可控解谜环境测试发现,LRM在简单问题上表现不如传统大模型(LLM),中等复杂度时略占优势,但当问题过于复杂时,两类模型准确率均降至零。即使提供明确算法提示,LRM仍无法稳定执行任务,暴露出其推理能力的局限性。此外,研究还发现模型在简单问题上“过度思考”,复杂问题上则完全失效,不同谜题环境下的表现差异显著。这一研究为AI推理能力的进一步提升提供了重要参考。
来源:https://mp.weixin.qq.com/s/8B9wGazYnz07ShEE4rcE7g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 11:59 , Processed in 0.284026 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表