通义实验室发布WebDancer:突破数据与训练瓶颈,打造自主Deep Research智能体

[复制链接]
周大 发表于 前天 15:14 | 显示全部楼层 |阅读模式
WebDancer 是一款致力于解决信息检索领域中高质量训练数据稀缺和开放环境训练复杂问题的新型智能体。它通过 CRAWLQA 和 E2HQA 两种数据合成策略生成高质量训练数据,并结合 ReAct 框架内化 agentic 能力。其两阶段训练策略(SFT 和 RL)显著提升了性能,尤其在 GAIA 和 WebWalkerQA 数据集上的表现超越了 GPT-4o 等基线模型。实验表明,WebDancer 在复杂任务中展现了强大的泛化能力和鲁棒性。未来,WebDancer 将集成更多工具,扩展至长文本写作任务,并进一步探索开源 agent 模型的潜力,为自主智能体的发展开辟新路径。
来源:https://mp.weixin.qq.com/s/D9cV_T6pZrXBwHKMij7e1g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-14 22:24 , Processed in 0.284644 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表