跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
浙江大学赵俊博团队联合多方发布并开源千亿级扩散语言模型LLaDA 2.0,首次实现扩散架构在超大规模上的突破。相比自回归模型,该模型支持并行解码与token直接编辑,在生成效率、数据利用率方面展现优势,并揭示了扩散语言模型独特的Scaling Law。尽管训练与推理生态仍处早期,已有谷歌、字节等入局,未来发展潜力引发关注。
来源:https://mp.weixin.qq.com/s/75YLziBSl-FtA4His9ml5A

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-16 02:32 , Processed in 0.250091 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表