谷歌、OpenAI争相让旗下AI玩《精灵宝可梦》游戏：衡量AI真正实力

时间：2026-01-25 22:46:05 来源：快看科技资讯

体育资讯01月25日称据科技媒体 Tom's Hardware 今天报道，当今时代我们有无数种跑分测试和评测方法来衡量 AI 的聪明程度与能力，但最近一种相对小众的测试方法也在 AI 圈内引发关注。

目前，谷歌、OpenAI 和 Anthropic 等 AI 巨头正在让自家模型游玩经典的《精灵宝可梦》系列游戏，以此来评估 AI 性能表现。

Anthropic 公司 AI 部门负责人 David Hershey 对此表示：“《精灵宝可梦》之所以能吸引机器学习社区关注，是因为它不像《Pong》等简单游戏那样受限。这种游戏对电脑程序来说非常具有挑战性”。

Hershey 从去年开始在 Twitch 平台进行直播，每天的日常就是用公司自产模型 Claude 玩《精灵宝可梦》。这名负责人平时的工作就是帮助客户部署 AI，因此他开直播本质上也是在测试模型。

这名负责人给自家 AI 直播游戏的做法也启发了不少自由开发者，他们也陆续搞了“Gemini 玩《宝可梦》”“GPT 玩《宝可梦》”等类似的直播节目。

后来，这些直播甚至被谷歌和 OpenAI 注意到，开发团队有时还会客串直播间亲自调整模型参数，在官方力量注入下，Gemini 和 GPT 已经成功通关了 Gam Boy 时代的《宝可梦蓝》，目前已在挑战续作；而 Claude 至今还没打通任何一个版本。

至于为何要用《宝可梦》评估 AI 性能？Hershey 对此解释道：“因为它给我们提供了直观的方法观察模型表现，还能用量化指标评估性能”。

通常来讲，玩家在《宝可梦》系列游戏中需要升级、训练已有 / 刚抓的宝可梦，还要打败道馆馆主来捕捉新的宝可梦。这种游戏流程并非线性，而是充满着判断和取舍。

而且，玩家还要经常在游戏中做出选择：是先冒险挑战强大的训练家以获取珍稀宝可梦，还是稳扎稳打造出一支实力均衡的队伍。

显然，人类非常擅长做此类决策，这也是游戏的乐趣所在，但对于 AI 来说，这是一场关乎逻辑推理、风险评估以及长期规划能力的综合考验。

因此研究人员会深入剖析 AI 在游戏里的决策方式，深入理解模型的能力边界。

Hershey 还会将 AI 玩《宝可梦》的结果分享给客户以改进控制框架（IT之家注：harness），帮助他们提升算力使用效率，让模型更高效运转。

标签游戏衡量实力真正精灵

上一篇：拒绝刷新最差战绩！准备北伐TES击败iG战绩来到了24负！

下一篇： JackeyLove：大家今天状态非常不错昨天要是赢了就3分了有点可惜

谷歌、OpenAI争相让旗下AI玩《精灵宝可梦》游戏：衡量AI真正实力

热门专题

相关信息

DOTA2解说杰出解析EWC24队：石油杯终极前瞻！助力CN刀塔突出重围

Inspired：其实我们打得并不差，只是BLG确实更强

Zeka：T1虽然输了但我依旧认为比BLG强顶尖强队对决就在毫厘之间

这阵容咋选的FUR巢虫团一波爆炸Doran上路通关T1赢下首局

这就是我们看TES的表情英文流看LYON被打猝死团发出尖锐爆鸣声

wayward：ZDZ去TES还不如我回去，不是我看不起他，他是小心脏啊

王多多：明天比赛更看好西班牙和美国美国的红牌缓期让人无语

把HLE叫来延续纪录！BLG今年国际赛BO5已经豪取六连胜未尝败绩

谦逊Bin！Bin赛后更博：再赢一场进决赛吧兄弟们！

Bin：HLE说会3比1我们，但我觉得我们会3比1他们

06月25日NBA选秀大会次轮全场录像

06月21日男篮热身赛杭州站中国男篮澳大利亚男篮全场录像

06月14日NBA总决赛G5尼克斯马刺全场录像

06月11日NBA总决赛G4马刺尼克斯全场录像

06月09日NBA常规赛总决赛G3马刺尼克斯全场录像

06月06日NBA总决赛G2尼克斯马刺全场录像

06月04日男篮热身赛长沙站中国男篮FMP拉德尼基全场录像

06月04日NBA总决赛G1尼克斯马刺全场录像

06月03日男篮热身赛长沙站中国男篮FMP拉德尼基全场录像

05月31日CBA总决赛G3广厦上海全场录像

相关集锦

中国男篮击败中国台北晋级第二阶段赵继伟17+6杨瀚森10+5

07月06日WNBA常规赛印第安纳狂热8468拉斯维加斯王牌全场集锦

夏联勇士金队大胜马刺伦德博格11分8板2帽李贤重11分

夏联国王逆转勇士蓝队郭昊文首秀9分钟4分3助夏普18分

夏联湖人双加时逆转险胜热火卡尔26+8沃特森补篮绝杀

WNBA常规赛达拉斯飞翼8976多伦多节奏全场集锦

夏联篮网大胜雄鹿汉姆里奇斯15+7波士顿14分

07月06日男篮世亚预阶段一约旦男篮10667伊拉克男篮全场集锦

07月05日WNBA常规赛波特兰火焰7772西雅图风暴全场集锦

夏联爵士加时险胜老鹰榜眼彼得森28分8号秀弗莱明斯16中4

热门TAG