跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token | MEET2026

周大发表于 4 天前

浙江大学赵俊博团队联合多方发布并开源千亿级扩散语言模型LLaDA 2.0，首次实现扩散架构在超大规模上的突破。相比自回归模型，该模型支持并行解码与token直接编辑，在生成效率、数据利用率方面展现优势，并揭示了扩散语言模型独特的Scaling Law。尽管训练与推理生态仍处早期，已有谷歌、字节等入局，未来发展潜力引发关注。
来源：https://mp.weixin.qq.com/s/75YLziBSl-FtA4His9ml5A

		自动登录	找回密码
密码			立即注册

课程导航

跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token | MEET2026