DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

[复制链接]
周大 发表于 2025-10-21 14:29:15 | 显示全部楼层 |阅读模式
DeepSeek在GitHub开源了参数量约3B的DeepSeek-OCR模型,首次探索“光学二维映射压缩”技术在长文本处理中的应用。模型由DeepEncoder和DeepSeek3B-MoE-A570M解码器构成,可在高分辨率输入下实现高效压缩与视觉token生成。实验表明,当压缩率低于10×时,OCR识别精度高达97%;即便压缩率达20×,准确率仍维持在60%左右,为长上下文压缩及大模型记忆机制研究提供了重要参考。
来源:https://tech.ifeng.com/c/8ncqIoQNng7

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 12:46 , Processed in 0.278495 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表