首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

[复制链接]
周大 发表于 2025-10-31 15:12:24 | 显示全部楼层 |阅读模式
NTU与StepFun联合推出IGGT,一种端到端统一Transformer模型,首次融合3D几何重建与实例级语义理解。该研究构建了含15K场景、2亿图像的大规模数据集InsScene-15K,并提出“实例接地”新范式,通过生成3D一致实例掩码实现与任意VLM/LMM的即插即用集成。IGGT在实例跟踪任务中IOU达70%、成功率90%,可同时支持空间跟踪、开放词汇分割与场景问答,显著提升多任务泛化能力,为三维场景理解提供新范式。
来源:https://mp.weixin.qq.com/s/rT8C2tsPMpRG24vy5AZ84A

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:06 , Processed in 0.301796 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表