智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了

[复制链接]
周大 发表于 2025-10-23 14:56:36 | 显示全部楼层 |阅读模式
智谱AI近日开源视觉Token方案Glyph,几乎同步于DeepSeek-OCR发布,旨在解决LLM长上下文处理难题。Glyph将文本转为图像输入,实现在128K上下文窗口下处理百万级Token任务,压缩率达3–4倍,保持主流模型准确度的同时提速约4倍。类似地,DeepSeek-OCR用100视觉Token完成800文本Token任务,准确率达97.3%。两项技术均凸显视觉输入在压缩效率与多模态潜力上的优势,引发关于像素或成AI基本输入单元的讨论,并呼应人脑视觉优先的信息处理机制。
来源:https://tech.ifeng.com/c/8nfamLDX7lL

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 12:30 , Processed in 0.292755 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表