上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型

[复制链接]
周大 发表于 2025-11-1 13:55:01 | 显示全部楼层 |阅读模式
上海人工智能实验室提出新型序列生成范式 SDAR,通过“训练-推理解耦”结合自回归模型的高性能与扩散模型的并行优势,实现高效推理。实验证明,SDAR 在保持甚至超越 AR 模型性能的同时,带来最高 2.3 倍的实际加速,并在 ChemBench 和 GPQA-diamond 等科学任务中分别提升 12.3 和 5.5 个百分点。该方法仅需 50B token 即可完成适配,成本远低于同类方案,且已全面开源 1.7B 至 30B 全系列模型及推理引擎,为大模型高效部署和复杂推理提供了兼具性能与效率的新路径。
来源:https://mp.weixin.qq.com/s/4tsKIXSSuNE8Q0VzIQ-70Q

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:14 , Processed in 0.274699 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表