谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注

2026年1月25日

（图片来自网络）

据科技媒体报道，谷歌、OpenAI、Anthropic等人工智能巨头近期将经典游戏《精灵宝可梦》作为创新方式，用来评估自家AI模型的性能表现。

选择《精灵宝可梦》的原因：《精灵宝可梦》系列游戏对电脑程序挑战性较高，不同于《Pong》等简单游戏。Anthropic公司AI部门负责人David Hershey表示，该游戏能直观展示AI表现并量化性能。他通过直播让公司自产模型Claude游玩《精灵宝可梦》，不仅作为测试模型，还启发众多开发者效仿，开展“Gemini玩《宝可梦》”“GPT玩《宝可梦》”等类似直播项目。后来，谷歌和OpenAI团队注意到这些直播，有时会客串直播间调整模型参数，在官方推动下，Gemini和GPT已成功通关Game Boy时代的《宝可梦蓝》，目前正挑战续作；而Claude至今尚未打通任何一个版本。

《精灵宝可梦》游戏流程具备复杂性，玩家需升级、训练宝可梦、挑战道馆馆主以捕捉新宝可梦，流程非线性且充满判断与取舍。玩家需选择是先冒险挑战强大训练家获取珍稀宝可梦，还是稳步打造实力均衡的队伍。这类决策考验AI的逻辑推理、风险评估与长期规划能力，研究人员会剖析AI在游戏中的决策方式，深入理解其能力边界。Hershey还会将AI玩《宝可梦》的结果分享给客户，以改进控制框架，帮助他们提升算力使用效率，让模型更高效运转。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2026-01-25 17

这种创新性的评估方式，让AI研究更贴近真实场景，很有意义。
网友9 2026-01-25 17

AI在《精灵宝可梦》中的表现能反映很多能力，这种测试方法很聪明。
网友8 2026-01-25 17

用经典游戏作为测试载体，既有趣又有学术价值，很满意～
网友7 2026-01-25 17

AI挑战《精灵宝可梦》体现了科技与游戏的融合，对理解AI能力有帮助。
网友6 2026-01-25 17

这种创新评估方法很务实，用大家熟悉的游戏，能更直观看到AI表现。
网友5 2026-01-25 17

《精灵宝可梦》我从小喜欢，现在看到AI玩，感觉科技和童年记忆结合，很奇妙。
网友4 2026-01-25 17

科技巨头搞这种测试，说明AI发展越来越贴近实际应用啦，很期待后续。
网友3 2026-01-25 17

谁能想到用童年游戏来评估AI性能，科技和经典结合太有趣啦！
网友2 2026-01-25 17

AI玩《精灵宝可梦》能看出它在复杂决策上的能力，很值得研究。
网友1 2026-01-25 17

这个用游戏测AI的方式很有意思，直观又有趣～

查看“谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注”相关搜索 >

谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注

精彩评论（10）

最新新闻