全球强化学习+VLA范式,PI*0.6背后都有这家中国公司技术伏笔

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
随着 Physical Intelligence 发布 π*0.6 和星动纪元提出 iRe-VLA,VLA 与在线强化学习结合成为具身智能新趋势。iRe-VLA 通过“冻结主干探索—解冻全模内化”的两阶段迭代机制,在仅用单卡 4090 的本地设备上稳定完成 RL 探索,并在云端整合经验,显著提升模型性能:仿真任务成功率从 43% 升至 83%,真实场景对新物体抓取成功率由 35% 提高到 80%,且泛化能力增强。该方法有效缓解模型坍塌、算力负担与灾难性遗忘问题,为大模型落地机器人提供了可行路径,已被 π*0.6 引用,标志中美在该领域形成前沿共振。
来源:https://mp.weixin.qq.com/s/_8imS0nG1Nhkak43lelK_w

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-16 02:36 , Processed in 0.274956 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表