纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究

周大发表于 2025-5-21 14:13:58

剑桥等机构联合推出基于强化学习的纯图像推理框架VPRL，实验表明其在多项视觉导航任务中准确率高达80%，性能超越文本推理至少40%。VPRL通过策略初始化与强化学习优化，有效提升复杂任务中的规划效率与稳定性，相比文本模型更具优势。该研究首次验证纯视觉推理可行性，为多模态推理开辟新方向，相关代码已开源。
来源：https://mp.weixin.qq.com/s/FNeGEV7Vccfga53GxC9MMg

		自动登录	找回密码
密码			立即注册

课程导航

纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究