谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注

2026年1月25日
news

(图片来自网络)

据科技媒体报道,谷歌、OpenAI、Anthropic等人工智能巨头近期将经典游戏《精灵宝可梦》作为创新方式,用来评估自家AI模型的性能表现。

选择《精灵宝可梦》的原因:《精灵宝可梦》系列游戏对电脑程序挑战性较高,不同于《Pong》等简单游戏。Anthropic公司AI部门负责人David Hershey表示,该游戏能直观展示AI表现并量化性能。他通过直播让公司自产模型Claude游玩《精灵宝可梦》,不仅作为测试模型,还启发众多开发者效仿,开展“Gemini玩《宝可梦》”“GPT玩《宝可梦》”等类似直播项目。后来,谷歌和OpenAI团队注意到这些直播,有时会客串直播间调整模型参数,在官方推动下,Gemini和GPT已成功通关Game Boy时代的《宝可梦蓝》,目前正挑战续作;而Claude至今尚未打通任何一个版本。

《精灵宝可梦》游戏流程具备复杂性,玩家需升级、训练宝可梦、挑战道馆馆主以捕捉新宝可梦,流程非线性且充满判断与取舍。玩家需选择是先冒险挑战强大训练家获取珍稀宝可梦,还是稳步打造实力均衡的队伍。这类决策考验AI的逻辑推理、风险评估与长期规划能力,研究人员会剖析AI在游戏中的决策方式,深入理解其能力边界。Hershey还会将AI玩《宝可梦》的结果分享给客户,以改进控制框架,帮助他们提升算力使用效率,让模型更高效运转。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-25 17
    这种创新性的评估方式,让AI研究更贴近真实场景,很有意义。
  • 网友9 2026-01-25 17
    AI在《精灵宝可梦》中的表现能反映很多能力,这种测试方法很聪明。
  • 网友8 2026-01-25 17
    用经典游戏作为测试载体,既有趣又有学术价值,很满意~
  • 网友7 2026-01-25 17
    AI挑战《精灵宝可梦》体现了科技与游戏的融合,对理解AI能力有帮助。
  • 网友6 2026-01-25 17
    这种创新评估方法很务实,用大家熟悉的游戏,能更直观看到AI表现。
  • 网友5 2026-01-25 17
    《精灵宝可梦》我从小喜欢,现在看到AI玩,感觉科技和童年记忆结合,很奇妙。
  • 网友4 2026-01-25 17
    科技巨头搞这种测试,说明AI发展越来越贴近实际应用啦,很期待后续。
  • 网友3 2026-01-25 17
    谁能想到用童年游戏来评估AI性能,科技和经典结合太有趣啦!
  • 网友2 2026-01-25 17
    AI玩《精灵宝可梦》能看出它在复杂决策上的能力,很值得研究。
  • 网友1 2026-01-25 17
    这个用游戏测AI的方式很有意思,直观又有趣~
查看“谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙