以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!

[复制链接]
周大 发表于 2025-5-23 15:19:47 | 显示全部楼层 |阅读模式
随着大语言模型参数规模快速增长,推理成本高昂成为行业痛点。华为团队发布三项关键技术,包括以加代乘的AMLA算子、融合算子优化以及SMTurbo内存加速技术,显著提升昇腾芯片在大模型推理中的速度与能效。其中,AMLA算力利用率突破71%,SMTurbo实现384卡跨节点超低延迟通信。这些技术不仅优化了昇腾生态,还为行业提供参考范本,助力大模型推理迈向更高效阶段。
来源:https://mp.weixin.qq.com/s/qYV0ptrGn6xL8nWO--L-eA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 12:05 , Processed in 0.273969 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表