华为昇腾系统实现每2秒解一道高数题,准万亿MoE模型训练全流程突破GPU限制

[复制链接]
周大 发表于 2025-5-30 14:41:12 | 显示全部楼层 |阅读模式
华为借助“昇腾+Pangu Ultra MoE”实现了国产算力全流程自主可控的训练闭环,在预训练阶段,昇腾Atlas 800T A2万卡集群MFU达到41%,而后训练阶段单CloudMatrix 384超节点吞吐达35K Tokens/s。华为提出三招解决技术痛点,包括提升训练集群利用率、释放昇腾单节点算力及首次披露高性能可扩展RL后训练关键技术。Pangu Ultra MoE模型具有7180亿参数量,包含61层Transformer。在RL后训练阶段,采用混合并行策略实现每超节点35K Tokens/s的高吞吐能力,效率极高,每2秒即可完成一道高等数学大题的解析。
来源:https://mp.weixin.qq.com/s/EnKbKpq8YAcqGnYJ7K9Bdg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 18:15 , Processed in 0.290918 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表