全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔

周大发表于 4 天前

随着 Physical Intelligence 发布 π*0.6 和星动纪元提出 iRe-VLA，VLA 与在线强化学习结合成为具身智能新趋势。iRe-VLA 通过“冻结主干探索—解冻全模内化”的两阶段迭代机制，在仅用单卡 4090 的本地设备上稳定完成 RL 探索，并在云端整合经验，显著提升模型性能：仿真任务成功率从 43% 升至 83%，真实场景对新物体抓取成功率由 35% 提高到 80%，且泛化能力增强。该方法有效缓解模型坍塌、算力负担与灾难性遗忘问题，为大模型落地机器人提供了可行路径，已被 π*0.6 引用，标志中美在该领域形成前沿共振。
来源：https://mp.weixin.qq.com/s/_8imS0nG1Nhkak43lelK_w

		自动登录	找回密码
密码			立即注册

课程导航

全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔