首个「自动化失败归因」研究：定位错误Agent与关键步骤

周大发表于 2025-5-30 14:19:15

多智能体 LLM 系统在复杂任务中展现出潜力，但任务失败后难以快速定位问题所在。ICML 2025 的一项研究提出了「自动化失败归因」的新方向，通过 AI 自动确定哪个 Agent 和在哪一步导致了失败。研究团队构建了首个基准数据集「Who&When」，包含 127 个失败日志及其细粒度标注。论文探索了三种方法（All-at-Once、Step-by-Step 和 Binary Search），实验表明现有方法效果有限，最佳模型在识别责任 Agent 和定位错误步骤上的准确率分别为 53.5% 和 14.2%。混合策略虽能提升性能，但计算成本较高，显示该领域仍需进一步突破。
来源：https://mp.weixin.qq.com/s/etweZ18bWWVz7thglMdGXA

		自动登录	找回密码
密码			立即注册

课程导航

首个「自动化失败归因」研究：定位错误Agent与关键步骤