开源界长推理天花板:MiniMax-M1 上下文一次性撑到 1 M

[复制链接]
周大 发表于 前天 14:52 | 显示全部楼层 |阅读模式
MiniMax 近日开源了推理大模型 MiniMax-M1,其上下文窗口达 1M,输出长度为 80K,成为开源领域长推理能力最强的模型之一。M1 在 TAU-Bench 测试中表现优异,40K 输出超越 Gemini 2.5 Pro,80K 版本进一步提升 2-3%。其核心优势在于充足的“思考预算”和基于真实工具的强化学习,同时通过自研 CISPO 算法将 RL 成本降至 53 万美元。此外,M1 的推理效率显著提高,FLOPs 增长接近线性,远超同类模型。实测表明,M1 在分析复杂财报和编程任务中表现出色,为 Agent 系统提供了一个强大的底座雏形,兼具长、快、开源、可训的特点,有望推动大模型在多步任务链中的实际应用。
来源:https://mp.weixin.qq.com/s/Ubyp-EH04zoyW5qiXqSW2Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-20 13:24 , Processed in 0.273025 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表