抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

周大发表于 2025-10-12 16:02:04

抖音SAIL团队与LV-NUS Lab联合发布多模态大模型SAIL-VL2，涵盖2B至8B中小参数规模，在106个数据集上实现性能领先。该模型在OpenCompass等基准测试中超越同规模开源模型，SAIL-VL2-2B得分70.31，位列4B以下开源第一；思维增强版本SAIL-VL2-8B-Thinking得54.4分，接近GPT-4o-latest。通过稀疏MoE架构、三阶段预训练、高质量数据构建及五阶段后训练策略，模型在复杂推理与视觉理解任务中表现出色，同时支持任意分辨率输入，并已全面开源，推动高效多模态模型发展。
来源：https://mp.weixin.qq.com/s/QfOU6PfWvWfuY5B6u-S2mg

		自动登录	找回密码
密码			立即注册

课程导航

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o