7B小模型通过贪吃蛇游戏训练,数学推理能力超越GPT-4o

[复制链接]
周大 发表于 前天 15:09 | 显示全部楼层 |阅读模式
近日,来自莱斯大学、约翰霍普金斯大学及NVIDIA的研究团队提出了一种革命性的AI训练范式——视觉游戏学习(ViGaL)。通过让7B参数多模态模型玩贪吃蛇和3D旋转等街机游戏,模型不仅掌握了游戏技巧,还发展出强大的跨领域推理能力,在数学和几何任务上超越了GPT-4o等顶级模型。研究表明,游戏训练能够激发AI的通用认知能力,如空间理解和顺序规划,并将其迁移到多模态推理任务中。实验结果表明,结合多种游戏训练可显著提升性能,同时保持模型的通用视觉能力。这一发现为AI训练提供了新思路,展示了合成任务在提升泛化能力方面的巨大潜力。
来源:https://mp.weixin.qq.com/s/_gXH6dImQ2o6YU8PHjFJdQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-19 12:54 , Processed in 0.271061 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表