强化学习+大模型记忆:Mem-α,让智能体第一次学会“如何记忆”

[复制链接]
周大 发表于 前天 15:52 | 显示全部楼层 |阅读模式
Mem-α 首次将强化学习应用于大模型记忆管理,通过三层记忆架构和多维奖励机制,使模型能自主学习何时、如何存储与更新信息。实验表明,其在精确检索与长期理解任务中全面超越现有方法,记忆占用减少近50%,并在训练长度仅30K tokens的情况下,成功外推至474K tokens以上,准确率从38.9%提升至64.2%,展现出强大泛化能力,推动智能体记忆系统从规则驱动向学习驱动转变。
来源:https://mp.weixin.qq.com/s/O9vmwD_khWfMa785xolJsw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:09 , Processed in 0.273558 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表