NeurIPS2025 | 攻破闭源多模态大模型:一种基于特征最优对齐的新型对抗攻击方法

[复制链接]
周大 发表于 2025-10-17 14:03:23 | 显示全部楼层 |阅读模式
研究表明,多模态大语言模型(MLLMs)虽性能强大,但在对抗样本攻击下存在安全隐患。针对闭源模型攻击迁移性低的问题,研究人员提出FOA-Attack框架,通过全局与局部特征的最优对齐及动态集成权重策略,显著提升攻击效果。实验显示其在GPT-4o等模型上的攻击成功率高达75.1%,揭示了当前MLLMs视觉编码的脆弱性,相关论文与代码已开源。
来源:https://mp.weixin.qq.com/s/PdwUJ7r0ibTUbK9sevZ2Wg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 12:22 , Processed in 0.339093 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表