任意Agent皆可强化学习!微软推出Agent Lightning框架,无需修改任何代码

[复制链接]
周大 发表于 2025-10-10 17:04:49 | 显示全部楼层 |阅读模式
微软推出AI Agent强化学习训练框架Agent Lightning,首次实现训练与执行完全解耦,支持任意Agent无缝接入且无需代码修改。通过统一数据接口和分层强化学习算法LightningRL,结合信用分配机制,显著提升多轮交互任务(如Text-to-SQL、RAG、数学问答)的训练效率与性能。该框架采用Server-Client架构,兼容现有监控系统,并支持PPO、DPO等主流算法,在可扩展性与实用性上取得突破,为AI Agent的持续进化提供标准化训练路径。
来源:https://mp.weixin.qq.com/s/2WmV7cVrC1DhkvhwUAZCLw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 17:45 , Processed in 0.292448 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表