ICCV 2025 | 浙大、港中文等提出EgoAgent：第一人称感知-行动-预测一体化智能体

周大发表于 2025-10-16 14:52:19

EgoAgent 是由多所高校联合提出的新型第一人称 AI 模型，在 ICCV 2025 获录。该模型首次在统一框架下联合学习视觉表征、人体动作与世界状态预测，受人类具身认知启发，通过 JEAP 架构实现三者协同优化。实验显示，其在世界预测、动作生成和视觉迁移任务上均超越现有模型，如在 ImageNet 上准确率提升 1.32%，在机器人操作中成功率提高近 4%。消融研究证实任务间存在正向反馈，且语义空间学习优于像素重建。这一范式有望推动机器人、AR/VR 等领域发展。
来源：https://mp.weixin.qq.com/s/esYoBCvW-EMJfcwu4tIBQg

		自动登录	找回密码
密码			立即注册

课程导航

ICCV 2025 | 浙大、港中文等提出EgoAgent：第一人称感知-行动-预测一体化智能体