Palisade Research 通过两场大规模“夺旗赛”验证了 AI 智能体在网络安全领域的竞争力。首场比赛中,AI 在破解密码学与逆向工程题目时表现优异,四个 AI 成功破解 19 道题,最高排名进入前 5%。第二场更高难度比赛中,CAI 完成 20 项任务,超越 90% 的人类团队。研究发现,AI 解决高难度问题的能力已接近甚至超过人类高手,但仍面临与外部服务器交互等挑战。这表明 AI 在网络安全领域具备巨大潜力,但人类经验仍不可忽视。
来源:https://tech.ifeng.com/c/8jqwDW2PBMt