国科大等团队提出视觉精度搜索方法,突破多模态模型可解释性难题

[复制链接]
周大 发表于 昨天 14:15 | 显示全部楼层 |阅读模式
由中国科学院、新加坡国立大学、华为技术有限公司及中山大学联合开发的视觉精度搜索(VPS)方法,在多模态物体级基础模型的可解释归因技术上取得突破。该方法通过子模优化和集合函数评估,结合线索分数与协作分数,用更少的区域生成高精度归因图,有效解决现有方法在大规模或复杂模型中的局限性。实验表明,VPS 方法在 MS COCO、RefCOCO 和 LVIS 数据集上的多个指标显著超越现有方法,达到 SOTA 水平。此外,VPS 方法不仅能解释正确决策,还能揭示错误预测原因,助力模型改进。该成果获 CVPR 2025 满分评分并被评为 Highlight Paper(2.98% 接受率)。未来,团队计划将其应用于实际任务,进一步提升模型可靠性和安全性。
来源:https://mp.weixin.qq.com/s/QVMua-5RGfSJzH-_tv_gRA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-16 13:44 , Processed in 0.265130 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表