DeepSeek深夜发布“小更新”,R1-0528模型性能飙升,或提前呈现R2部分特性

[复制链接]
周大 发表于 2025-5-30 14:06:16 | 显示全部楼层 |阅读模式
DeepSeek近日发布新版本模型DeepSeek-R1-0528,并在Hugging Face平台开源。尽管官方将其定义为“小版本”升级,但其性能大幅提升,在Live CodeBench测试中得分73.1分,接近OpenAI的o3。新版本参数量达685B,上下文长度为164K,表现出强大的编程、推理及交互能力。用户反馈显示,其文本生成更自然,推理更深入,且能处理长达30-60分钟的单任务。部分业内人士猜测,这可能是原计划中的R2模型提前推出,但因效果未达预期而未升级版本号。此次更新进一步缩小了与领先模型的差距,对其他国产闭源大模型形成压力。
来源:https://tech.ifeng.com/c/8jj2IgF0LBX

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 00:15 , Processed in 0.299140 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表