欧几里得的礼物:通过几何代理任务增强视觉-语言模型中的空间感知和推理能力

[复制链接]
周大 发表于 2025-10-17 14:10:53 | 显示全部楼层 |阅读模式
来自华中科技大学、华东师范大学与北京中关村学院的研究团队提出将几何问题作为提升视觉-语言模型空间智能的代理任务,构建了含29,695题的几何数据集Euclid30K。实验显示,在该数据集训练后,模型在VSI Bench等四大基准上的空间推理能力显著提升,且消融研究证实性能增益源于几何任务本身而非数据量或算法设计,为解决当前模型空间智能不足提供了新路径。
来源:https://mp.weixin.qq.com/s/OfCiijFuj1nITUyAF7Svfw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 12:48 , Processed in 0.283744 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表