谷歌开始训练 DeepMind AI 玩《星际争霸2》

谷歌开始训练 DeepMind AI 玩《星际争霸2》

机械学习的一场艰难战斗

OwenNiu

PC
本文系用户投稿,不代表机核网观点

本文译自 PCGamer

我们已经见证了机械学习一次又一次在各种竞赛中击败人类,比如《危险边缘》(一档电视智力竞赛节目)中, IBM 的 Watson 击败了人类最强的选手。最近,谷歌的 DeepMind AI 击败了最强的围棋手。现在AI研究者们的目光放在了《星际争霸2》这个最流行的多人在线游戏之一身上。

暴雪表示支持,并提供了用于建造对抗人类玩家的机器人的工具。在去年宣布的和 DeepMind 的合作关系中,暴雪还要公布65,000场《星际争霸2》比赛数据的缓存,帮助机器人训练。这只是个开始——暴雪和 DeepMind 每个月都将再加五十万场比赛的缓存。

为什么着眼于《星际争霸2》?《星际争霸2》不光是时下最流行的电竞项目之一,还能为机械学习提供不少尚未攻克的难题。例如,围棋和国际象棋之类的游戏,被称作完全信息游戏(perfect information game)——AI可以知道对手所有的操作,并计算结果。在围棋盘上有1跟着170个0的可能性,但是在《星际争霸2》里,研究人员估算还要再加100多个0.
“这是一大步,” Oriol Vinyals,参与此项目的一位研究员,说道,“这款游戏迫使我们在计划,记忆,以及对不确定性的对策上进行创新。”

乍看上去,比起围棋或国际象棋,《星际争霸2》应该更容易攻克,但是无法知道所有信息带来了挑战。机器人只能看到和做到人类玩家能看到的画面和进行的操作。这会迫使机器人尝试与揣测玩家策略,并发展出自己的风格。

看AI对人类虽然很有趣,但是此项目有着深远的目的。谷歌已经用 DeepMind 的机械学习节约了大把数据中心的降温费用。有朝一日AI能在《星际争霸2》里战胜人类玩家时,它就能从事更加复杂的工作了。

“从科学的角度看,《星际争霸2》和生命的一些特性很像,” David Churchill,纽芬兰纪念大学教授,《星际争霸2》机器人比赛组织者说道,“这是我们将来在现实中用到的技术的试验场。”

研究人员们在真正实现此目的之前,还有很长的路要走。早期结果显示,机器在《星际争霸2》里还是远远比不上人类的。

24

查看更多评论