DeepMind再登Nature:AI Agent造出了最强RL算法!

[复制链接]
周大 发表于 2025-10-28 15:09:26 | 显示全部楼层 |阅读模式
Google DeepMind在Nature发表研究,提出DiscoRL方法,使智能体能在多环境交互中自主发现强化学习规则。实验显示,基于57款Atari游戏训练的Disco57以IQM 13.86成绩超越MuZero等主流算法,并在ProcGen、Crafter和NetHack等未见任务中展现强泛化能力;扩展至103个环境的Disco103表现更优。最优规则在约6亿步内被发现,效率远超人工设计。研究表明,RL算法性能随环境多样性与计算量提升而增强,未来高级AI的算法或可由机器自动构建。
来源:https://mp.weixin.qq.com/s/fVKbQfpUd3yVBlEkxIj9xQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:23 , Processed in 0.281916 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表