谷歌Gemini 2.5 Pro通关《宝可梦蓝》,发现30年游戏Bug并展现复杂任务解决能力

[复制链接]
周大 发表于 前天 14:45 | 显示全部楼层 |阅读模式
谷歌发布的Gemini 2.5系列大模型技术报告详细记录了AI在《宝可梦蓝》中的表现。AI展现了惊人的创造力和长期规划能力,例如利用“飞行”技能逃脱死循环、调整队伍击败道馆馆主,并成功完成多项复杂任务,包括获取隐藏技能和解决迷宫难题。然而,AI也暴露出“恐慌”状态、幻觉问题和思维定势等局限性。整个项目始于Twitch直播间,Gemini 2.5 Pro耗时831小时首次通关,第二次通关时间缩短至一半。目前,Gemini 2.5 Pro正挑战《宝可梦黄》原版困难模式,同时Claude 4也加入比赛,引发关注。
来源:https://mp.weixin.qq.com/s/fOGbijWnqEloziC3TISz_w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-20 14:34 , Processed in 0.286260 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表