搜索
当前位置:首页 > 资讯详情
人“攻”智能
作者: 作者单位:新软件 所属类别:电子信息 2019-02-01 09:56:49 浏览:1457
  自2016年AlphaGO战败人类围棋高手以来,人工智能系统就没有停止将人类按在地板上摩擦的脚步。现今的人工智能也开始进军人类的游戏界,狂虐人类高级玩家。2018年8月由OpenAI组建的电竞战队OpenAI Five在《Dota 2》中击败了5组游戏战队,而在今年的1月25日,谷歌的Alpha“兄弟”AlphaStar首次亮相,与《星际争霸II》职业选手TLO和MaNa进行激烈厮杀,并以10:1的辉煌战绩,将人类高手打到找不到北。
  从游戏性来讲《Dota 2》也就是一名玩家操作一名英雄进行作战,考验的是玩家的意识和单个英雄的操作水平。而《星际争霸II》是一款极为复杂的战略游戏,其兵种搭配和发展模式千变万化,战场上的战机稍纵即逝玩家要审视战场的局势和特定的时刻做出相应的判断,并在对手信息不完全的情况下快速操作,这就需要玩家对该款游戏进行大量的实时训练。对于AI而言,这类游戏比国际象棋、围棋等棋盘类游戏来得更难,不仅因为没有最佳策略,也是因为人工智能无法通过观察前一块棋子的移动来计算下一步棋,而必须实时做出反应。而AlphaStar的训练量相当于打了200年的实时训练,对于人类而言,如果刚出生就开始打星际,在不吃、不喝、不睡的情况下我们也活不了200岁。
  AlphaStar凭什么打败人类选手?
  AlphaStar与普通AI不太一样,它所使用的深度神经网络是通过监督学习(supervised learning)和强化学习(reinforcement learning)直接从原始游戏数据当中进行训练。也就是说,它成长的每一步都是一场完整的比赛。
  本次比赛使用的是《星际争霸II》在2018年10月推出的4.6.2版本,双方都使用“神族”,地图选在在Catalyst(汇龙岛)。据官方表示,该图可创造出很多进攻路线和防守策略。比赛采用1V1的方式,经过10回合的比赛,两位世界顶级的《星际争霸II》高手以0:10的战绩惜败。在今年1月25日DeepMind推出了新版AlphaStar在没有经过测试的前提下与人类高手MaNa进行较量,最终人类赢得了比赛,这场《星际争霸II》的比赛人工智能以10:1的战绩收场。
  那么AlphaSta凭什么打败人类选手??AlphaStar最先通过研究上百万份《星际争霸2》玩家天梯录像进行自我学习,然后再进入一种类似于"AlphaStar联赛"的互相训练赛模式进行学习,这种左右互搏之术让AlphaStar成长创造出自己的三种不同"自我"型号,分别是:"普通型"、"极致操作不败型"、"拟人型"。经过一个星期的学习之后,AlphaStar已经能够击败研究所内最会打星际的研究员(大约天梯5000分实力)。
  "AlphaStar联赛"是无数个AlphaStar AI内部进行的对抗系统,在整个项目当中也功不可没。而颇为有趣的一点是,此次出战的三个AlphaStar,是从无数个AI当中厮杀出来的,表现最为优异的几个,而剩下的那些则遭到无情淘汰,这种养蛊模式也颇有些"大逃杀"的味道。AI们最初通过研究人类玩家的录像进行训练,然后和联赛中的其他AI进行训练。在每次循环中,新的参赛者从原来的竞争者中分支出来,而原来的参赛者被冻结。同时可以调整确定每个可能已经适应的智能体的学习目标的匹配概率和超参数,从而在保持多样性的同时增加难度。通过从参赛者的游戏结果中加强学习来更新代理的参数。最终的AI从联赛的纳什分布中抽样选出。而最强款的AlphaStar一周练习量相当于人类200年的练习量,这一点酷似当初的围棋AI——AlphaGO。DeepMind使用了一种"关系性深度强化学习"的方法。比如在游戏中选择哪个兵种对于AI而言是一个概率问题,如何让这个概率选择最优化,就需要AI进行大量的学习迭代。
  在围棋的世界里,仅有19X19棋盘,也就是361个落点需要计算,而星际2中,需要计算的量是10^26,这一天文数字的变量让AI举步维艰,但是一旦破局成功,AI的成长也是惊人。DeepMind研发的AlphaStar超出了所有人的想象,得益于他们技术和资本的优势,他们拥有超群的TPU算力,举个例子,普通AI团队能够让他们的AI每天练习学习数十局,而DeepMind可以让他们的AI每天练习学习一百万局。
  AI的初衷是否是颠覆?
  虽然AlphaStar的直接专业水平和无与伦比的学习速度,对于任何一个星际争霸玩家来说,都不算一个好消息。但游戏玩家可能亦可能从AI的打法中学到一些有效的策略。AlphaStar大胜人类职业玩家,不仅是震惊游戏界的大新闻,它展示了AI技术潜藏的实力,在需要大量知识和经验的领域,正以惊人的方式超越人类玩家。有很多专家认为《星际争霸》是如此复杂,能解决《星际争霸》的AI将能解决任何其他问题。尽管目前AlphaStar玩星际还有很多限制,对手也不是人类最强玩家,但其背后的技术拥有难以估量的价值,在医疗健康、天气预测等与人类生活息息相关领域都可能发挥巨大的作用。

参与评价

最新评价

相关推荐

最热资讯

账号密码登录
第三方快速登录
找回密码