谷歌、OpenAI等AI巨头用《精灵宝可梦》评估AI性能引发关注
(图片来自网络)
据科技媒体报道,谷歌、OpenAI、Anthropic等人工智能巨头近期将经典游戏《精灵宝可梦》作为创新方式,用来评估自家AI模型的性能表现。
选择《精灵宝可梦》的原因:《精灵宝可梦》系列游戏对电脑程序挑战性较高,不同于《Pong》等简单游戏。Anthropic公司AI部门负责人David Hershey表示,该游戏能直观展示AI表现并量化性能。他通过直播让公司自产模型Claude游玩《精灵宝可梦》,不仅作为测试模型,还启发众多开发者效仿,开展“Gemini玩《宝可梦》”“GPT玩《宝可梦》”等类似直播项目。后来,谷歌和OpenAI团队注意到这些直播,有时会客串直播间调整模型参数,在官方推动下,Gemini和GPT已成功通关Game Boy时代的《宝可梦蓝》,目前正挑战续作;而Claude至今尚未打通任何一个版本。
《精灵宝可梦》游戏流程具备复杂性,玩家需升级、训练宝可梦、挑战道馆馆主以捕捉新宝可梦,流程非线性且充满判断与取舍。玩家需选择是先冒险挑战强大训练家获取珍稀宝可梦,还是稳步打造实力均衡的队伍。这类决策考验AI的逻辑推理、风险评估与长期规划能力,研究人员会剖析AI在游戏中的决策方式,深入理解其能力边界。Hershey还会将AI玩《宝可梦》的结果分享给客户,以改进控制框架,帮助他们提升算力使用效率,让模型更高效运转。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月25日:“厂二代”靠短视频破局:传统工厂后代自媒体获客引关注
- 2026年1月25日:卡西欧发布SX-C1复古采样器:融合Game Boy与SP-404的造型设计
- 2026年1月25日:AI医疗热潮下,蚂蚁阿福月活破3000万:大厂布局健康服务引关注
- 2026年1月25日:警惕!黑客新手段绕过验证窃取企业登录凭证
- 2026年1月25日:雷军三次泪目!小米熔岩橙彻底停售,背后真相令人扎心
- 2026年1月25日:银河通用成为总台2026春晚指定具身大模型机器人
- 2026年1月25日:对话优必选周剑:为了造出真正的人形机器人,我愿意赌上一切
- 2026年1月25日:国内首批太空游客2028年起航 创始人雷诗情谈跨界太空路
- 2026年1月25日:上海交大发布光学领域大模型Optics GPT,打造‘虚拟光学专家’
- 2026年1月25日:vivo叫停AI眼镜项目,「百镜大战」行业格局变化
- 2026年1月25日:河南智造创新突破!电子鼻3秒识水,无人巴士与智能机器人等数智技术亮点纷呈 - 数智新河南
- 2026年1月25日:宁德时代推出超混电池 三元与铁锂走向融合?
- 2026年1月25日:波士顿动力详解Atlas人形机器人:工厂作业省心,家用暂处探索期
- 2026年1月25日:中国空间站动态|神舟二十号返回前准备全梳理!
- 2026年1月25日:科杰科技高海玲:Data&AI一体化,是企业未来十年的增长核心
- 2026年1月25日:海南12345热线:封关首年成为自贸港与世界沟通桥梁
- 2026年1月25日:研究证实电动汽车普及与空气污染减少呈正相关
- 2026年1月25日:ChatGPT老用户忍痛卸载:OpenAI在AI竞争中遇挑战
- 2026年1月25日:荣耀钱包记账功能开启众测,暂不支持微信App及部分场景
- 2026年1月25日:陶哲轩认证!GPT - 5.2攻克数学百年难题,数学界掀新变革

精彩评论(10)