开源即爆火!英伟达重磅推出OmniVinci全模态大模型

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
英伟达开源了9B参数的全模态大模型OmniVinci,实现视觉、音频与语言的统一理解,上线一周下载超1万次。该模型在多项基准测试中超越同类产品,仅用约1/6数据量即达成更优性能。其三大架构创新与2400万条多模态数据引擎显著提升跨模态对齐与时间感知能力,并通过隐式与显式学习降低“模态幻觉”。实验显示音视频联合输入大幅提升理解效果,结合强化学习后性能进一步增强。OmniVinci在医疗、机器人、体育解说等多场景中展现强大应用潜力,且可在消费级显卡低延迟运行,推动全模态AI向实用化迈进。
来源:https://mp.weixin.qq.com/s/_UWCx0_3D_JCaSf89KVWqw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:09 , Processed in 0.286950 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表