算力成本大降!马尔可夫思考机来了,LLM推理成本直接降为线性

[复制链接]
周大 发表于 2025-10-10 17:07:33 | 显示全部楼层 |阅读模式
Mila 与微软研究院等团队提出“马尔可夫式思考机”新范式 Delethink,通过将推理过程分块并限制状态大小,使 LLM 长思考的计算复杂度从二次级降至线性。实验表明,在 24K 至 96K token 思考长度下,Delethink 训练的模型在数学任务中表现优于传统 LongCoT 方法,且在 AIME’24 上达到 49% 准确率。计算成本显著降低:94K token 推理训练从 27 个 H100-月减至 7 个。该方法兼容从小模型到 120B 参数大模型,展现出广泛扩展潜力,为高效推理架构提供了新方向。
来源:https://mp.weixin.qq.com/s/bIY_2cs4UOv3_oYSRpu3XA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 17:53 , Processed in 0.299243 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表