大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%

[复制链接]
周大 发表于 前天 14:51 | 显示全部楼层 |阅读模式
上海AI Lab提出的LEMMA方法,通过构建“错误-反思-修正”数据,让大模型像人类一样从错误中学习。该方法利用教师模型生成针对性错误数据,并结合两种纠错策略(返回上一步或推倒重来),显著提升了模型的数学推理能力。实验表明,LEMMA在Llama3-8B上将数学题解题准确率提升了13.3%,并在MathChat任务中大幅领先现有方法。此外,消融实验验证了其关键模块的有效性,相关成果已发表于ACL’25 Findings。
来源:https://mp.weixin.qq.com/s/qHATXYDZKzYlXwinlMUFuw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-20 13:25 , Processed in 0.284383 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表