抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o

[复制链接]
周大 发表于 2025-10-12 16:02:04 | 显示全部楼层 |阅读模式
抖音SAIL团队与LV-NUS Lab联合发布多模态大模型SAIL-VL2,涵盖2B至8B中小参数规模,在106个数据集上实现性能领先。该模型在OpenCompass等基准测试中超越同规模开源模型,SAIL-VL2-2B得分70.31,位列4B以下开源第一;思维增强版本SAIL-VL2-8B-Thinking得54.4分,接近GPT-4o-latest。通过稀疏MoE架构、三阶段预训练、高质量数据构建及五阶段后训练策略,模型在复杂推理与视觉理解任务中表现出色,同时支持任意分辨率输入,并已全面开源,推动高效多模态模型发展。
来源:https://mp.weixin.qq.com/s/QfOU6PfWvWfuY5B6u-S2mg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 17:50 , Processed in 0.283120 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表