国内两大AI厂商同日开源新模型:MiniMax-M1支持百万tokens长文本推理,Kimi-Dev-72B创代码生成新纪录

[复制链接]
周大 发表于 前天 15:06 | 显示全部楼层 |阅读模式
国内大模型厂商 MiniMax 和月之暗面同日发布开源新成果 MiniMax-M1 和 Kimi-Dev-72B。MiniMax-M1 支持最长上下文窗口(100 万 tokens 输入),并在强化学习中采用高效算法 CISPO,训练成本仅 53.47 万美元。该模型在 SWE-bench 验证基准上取得 56.0% 的优异成绩。Kimi-Dev-72B 则以 60.4% 的成绩刷新 SWE-bench Verified 的 SOTA 记录,通过 BugFixer 和 TestWriter 的协作机制提升代码修复能力。两者在代码生成任务中各有优势,MiniMax-M1-80K 在实际测试中表现更优。此外,MiniMax 提供免费使用和低价 API,而 Kimi-Dev-72B 开放了源代码与技术文档,为开发者提供更多选择。
来源:https://mp.weixin.qq.com/s/8iNPu9IQvcQpz65mVsy9WA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-19 13:48 , Processed in 0.267132 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表