ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

[复制链接]
周大 发表于 2025-10-16 14:52:19 | 显示全部楼层 |阅读模式
EgoAgent 是由多所高校联合提出的新型第一人称 AI 模型,在 ICCV 2025 获录。该模型首次在统一框架下联合学习视觉表征、人体动作与世界状态预测,受人类具身认知启发,通过 JEAP 架构实现三者协同优化。实验显示,其在世界预测、动作生成和视觉迁移任务上均超越现有模型,如在 ImageNet 上准确率提升 1.32%,在机器人操作中成功率提高近 4%。消融研究证实任务间存在正向反馈,且语义空间学习优于像素重建。这一范式有望推动机器人、AR/VR 等领域发展。
来源:https://mp.weixin.qq.com/s/esYoBCvW-EMJfcwu4tIBQg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 15:27 , Processed in 0.281337 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表