智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

周大发表于 2025-10-23 14:56:36

智谱AI近日开源视觉Token方案Glyph，几乎同步于DeepSeek-OCR发布，旨在解决LLM长上下文处理难题。Glyph将文本转为图像输入，实现在128K上下文窗口下处理百万级Token任务，压缩率达3–4倍，保持主流模型准确度的同时提速约4倍。类似地，DeepSeek-OCR用100视觉Token完成800文本Token任务，准确率达97.3%。两项技术均凸显视觉输入在压缩效率与多模态潜力上的优势，引发关于像素或成AI基本输入单元的讨论，并呼应人脑视觉优先的信息处理机制。
来源：https://tech.ifeng.com/c/8nfamLDX7lL

		自动登录	找回密码
密码			立即注册

课程导航

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了