研究揭示主流大模型缺乏人类工作记忆能力,17款模型测试均未达标

[复制链接]
周大 发表于 昨天 14:13 | 显示全部楼层 |阅读模式
一项新研究通过三套实验测试了17个热门大语言模型的工作记忆能力,发现即使是GPT-4、LLaMA等先进模型也未能完全模拟人类的短期记忆功能。实验结果表明,这些模型更多依赖上下文窗口而非真正意义上的内部记忆调用。研究建议未来可借鉴认知科学,探索通过“内存格”或强化学习等方式提升模型的记忆与推理能力,为实现更真实的对话和长链推理铺平道路。
来源:https://mp.weixin.qq.com/s/1HtgKVZXGOqjibBLoEJn8w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-16 14:18 , Processed in 0.270804 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表