混元3D开源端到端全景深度估计器,代码+精选全景数据已上线,在线可玩

[复制链接]
周大 发表于 2025-10-14 14:11:21 | 显示全部楼层 |阅读模式
腾讯混元3D团队提出DA2,一种端到端的全景深度估计模型,通过创新的数据扩充引擎将训练样本从6.3万增至60.7万,提升约10倍,显著缓解数据稀缺问题。其提出的SphereViT架构利用球面嵌入与交叉注意力机制有效应对球面畸变,在多个基准测试中表现优异,AbsRel指标较最强零样本方法平均提升38%,甚至超越域内方法。DA2在全景多视图重建等应用中展现出高精度与强泛化能力,相关代码与模型已开源。
来源:https://mp.weixin.qq.com/s/fJjFcp3rOVq_XYRTutfdBA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 15:29 , Processed in 0.276082 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表