纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

[复制链接]
周大 发表于 2025-5-21 14:13:58 | 显示全部楼层 |阅读模式
剑桥等机构联合推出基于强化学习的纯图像推理框架VPRL,实验表明其在多项视觉导航任务中准确率高达80%,性能超越文本推理至少40%。VPRL通过策略初始化与强化学习优化,有效提升复杂任务中的规划效率与稳定性,相比文本模型更具优势。该研究首次验证纯视觉推理可行性,为多模态推理开辟新方向,相关代码已开源。
来源:https://mp.weixin.qq.com/s/FNeGEV7Vccfga53GxC9MMg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 17:13 , Processed in 0.305294 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表