港大开源RAG-Anything系统:突破多模态文档理解瓶颈,实现图文表公式统一处理

[复制链接]
周大 发表于 前天 14:48 | 显示全部楼层 |阅读模式
香港大学黄超教授团队开源新一代多模态RAG系统 **RAG-Anything**,首次实现对文字、图表、表格、数学公式等复杂文档内容的统一智能理解。该系统突破传统RAG仅支持纯文本的局限,通过三阶段架构(多模态解析、知识图谱构建、混合检索生成),有效解决跨模态语义关联缺失、检索精度不足等问题,并支持PDF、Office、图像等10余种主流格式。RAG-Anything提供一键式自动化与精细化控制两种使用模式,具备模块化与插件式设计,适用于学术研究、财务分析、工程制图等多个专业场景。该项目已在GitHub开源,用户可通过PyPI快速部署。
来源:https://mp.weixin.qq.com/s/lFKyKvm0luZTpx8_nGyWEw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-28 12:32 , Processed in 0.261571 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表