中英双语、29项第一、像素级理解:360 FG-CLIP2登顶全球最强图文跨模态模型

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
360发布新一代图文跨模态模型FG-CLIP 2,在29项国际基准测试中全部夺冠,英文任务平均得分81.10,显著领先于Meta CLIP 2(72.71)和Google SigLIP 2(71.87),并在中文理解上超越阿里Chinese-CLIP。该模型基于自建的FineHARD数据集,含5亿图文对、4000万目标框及1000万难负样本,结合两阶段训练与五维优化体系,实现像素级细节识别。现已开源并开放API,应用于搜索、AIGC、安防与机器人等领域,标志着中国团队在多模态基础模型上的系统性突破。
来源:https://mp.weixin.qq.com/s/3YYHOuRrLpIm9xvFMMKKkA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:09 , Processed in 0.279121 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表