首个「自动化失败归因」研究:定位错误Agent与关键步骤

[复制链接]
周大 发表于 2025-5-30 14:19:15 | 显示全部楼层 |阅读模式
多智能体 LLM 系统在复杂任务中展现出潜力,但任务失败后难以快速定位问题所在。ICML 2025 的一项研究提出了「自动化失败归因」的新方向,通过 AI 自动确定哪个 Agent 和在哪一步导致了失败。研究团队构建了首个基准数据集「Who&When」,包含 127 个失败日志及其细粒度标注。论文探索了三种方法(All-at-Once、Step-by-Step 和 Binary Search),实验表明现有方法效果有限,最佳模型在识别责任 Agent 和定位错误步骤上的准确率分别为 53.5% 和 14.2%。混合策略虽能提升性能,但计算成本较高,显示该领域仍需进一步突破。
来源:https://mp.weixin.qq.com/s/etweZ18bWWVz7thglMdGXA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 00:43 , Processed in 0.289971 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表