腾讯AI大战王者荣耀!504场1v1仅输1场,5v5达电竞职业水平

  • 日期:08-09
  • 点击:(662)

日日博娱乐首页

原创智慧我想分享昨天image.php?url=0Mp9IE39yn

知识8月3日消息,昨晚,腾讯的战略合作AI“启蒙”再次问世,战斗王荣耀职业选手,获胜率相当惊人。

在当晚在吉隆坡举行的King's Glory最高规格电子竞技赛的世界冠军杯半决赛特别节目中,它赢得了专业团队带来的5v5级别测试,并升级为国王的荣耀电子竞技专业水平。

与此同时,“启蒙”的1v1版也在上海国际数字互动娱乐展上举行。 ChinaJoy向公众首次亮相,并为顶级业余选手开启了为期四天的体验测试。

在第一天的504次测试中,“热情”测试的胜率为99.8%,如果对手是国王荣耀之后的第一个,那么只有一场比赛失利。

image.php?url=0Mp9IElN3R

在过去,AlphaGo击败了世界围棋冠军李世石并直接引爆了第三次人工智能浪潮。但与现实世界相比,它解决的问题只是一记耳光。更复杂的即时战略游戏(RTS)正成为研究人员面临的新挑战。

业界普遍认为,预计下一个AI里程碑将来自这些策略游戏。

最受欢迎的分支之一是MOBA游戏。 Google DeepMind(星际争霸2),Facebook(星际争霸2)和Open AI(Dota 2)等团队正在推进此类研究。

早在两年前,腾讯还透露了关于AI国王荣耀的研究。在去年12月,在五名独立的AI学习开启黑人技能之后,5v5在国王的人类角色中扮演了国王的荣耀。经过250轮战争,AI获得了48%的胜率,几乎与人类并列。

人机大战的最新状态是什么?它背后的技术如何实现?本文将简要介绍这种人机战争背后的技术,重新制定游戏的精彩瞬间,并回顾腾讯AI探索代理研究的相关过程。

image.php?url=0Mp9IE0CLs

没有人类数据,人类每天的训练强度高达440年

“热情”这个名字意味着极大的洞察力,其技术开发始于2017年12月。一年后,“启蒙”通过了前职业球员和主力球队带来的顶级业余水平测试。

在这个测试中,新的“热情”版本建立了一个基于“观察 - 行动 - 奖励”的深度强化学习模型。

这个模型不需要人类数据,从白板学习(Tabula Rasa)开始,让AI对抗自己,一天的训练强度为440年。

人工智能已经从头开始全面探索成功经验,不仅学会了游戏常识,如何站立,玩野,协助保护,避免伤害,还惊讶于一种不同于人类正常实践的新策略的发展。

在游戏中测试的难点在于AI需要在信息不完整和高复杂性的情况下做出复杂而快速的决策。

在一张大而不完整的地图上,10名参与者在战略规划,英雄选择,技能应用,路径探索和团队合作方面面临着大量不间断的即时选择。这带来了极其复杂的情况,预计将有多达10种操作可能性。

你知道,宇宙中的原子总数只有10到80的幂。

该团队还创建了一个单一模型模型,以提高培训效率,优化沟通效率,提高AI的团队合作能力,并使用零和奖励和惩罚机制,以允许AI最大化团队利益,使其发挥决定性作用,并有一个良好的行为。

image.php?url=0Mp9IEwAcw

拆除“启蒙”的六个美好时刻

让我们回顾一下人工智能荣耀中的一些激动人心的时刻。

1.探索新战略

如图所示,在游戏开始时,“启蒙”没有选择传统的人行对齐策略。相反,双C英雄余吉和王昭君首先清理了第一波中线并压制敌人。然后他转向压制曹操血行的道路。

image.php?url=0Mp9IEc0oO

2.长期战略

在比赛期间,分队的三支队伍压制道路,“启蒙”决定性地选择在道路上使用三个AI反压分区,最终双方交换了一个塔来维持平衡。

image.php?url=0Mp9IEjn6g

3.团队合作

在比赛的中间,“启蒙”四人追逐Nako Lulu,AI Dharma踢了Naco Lulu进入AI组,然后四个AI完美匹配赢得他们的第一次杀戮。

image.php?url=0Mp9IExjXx

4.实时战略

在一对一的基础上,分区队伍中强大的曹操追求“启蒙”虞姬,虞姬在残血状态下退居高地。在看到曹操的反塔血量下降后,他抓住机会杀死了绝地。

image.php?url=0Mp9IEZU2R

5,即时战略+团队合作

在游戏的后半部分,在该师团队的高空塔楼战斗中,艾王昭君首先被对方杀死,“启蒙”决定性地选择了反击,带着一波又一波的战斗和充分的对手。

image.php?url=0Mp9IEb7IH

6,即时战略+团队合作

在团队击败团队之后,“启蒙”线尚未到来,高速公路塔中仍有一半以上的血液。 “启蒙”决定性地选择了四个人轮流攻击塔楼,并没有拆除塔楼的线路。

*注意:在比赛结束时,在球队击败球队之后,“启蒙”没有直接推进水晶,但在计算了整体收入后,选择先推上最后一座高地塔,然后将水晶推到胜利。

image.php?url=0Mp9IEwG1W

从三年开始,目标雄心勃勃

这不是腾讯AI Lab AI战争游戏玩家的第一场秀。

自2016年以来,腾讯人工智能实验室已开始披露代理商的研究过程。他们开发了Go AI“Fine Art”,现在是中国国家围棋队训练的AI。

2017年,“启蒙”发起,到2018年,“启蒙”已达到业余的顶级水平。

去年5月,匹兹堡腾讯AI实验室大学的研究人员向AI Summit ICML 2018提交了一篇论文《Hierarchical Macro Strategy Model for MOBA Game AI》,并在AlphaGo Zero中尝试了蒙特卡罗树搜索(MCTS)技术。一个好结果。

那个时候,AI只能扮演狄仁杰的英雄。几个月后,他们已经能够组建一支由“五人组成”的团队,他们已经回归了国王的位置和人类球员。

在去年12月的KPL秋季总决赛中,“热情”已经接受了由前职业KPL球员陈贵,零和专业评论白乐,九天和李仁组成的人类团队水平的考验。这些人类队伍的平均水平超过了99%的球员。

最后,AI团队赢得了比赛。

腾讯还赢得了VizDoom,这是拍摄类别中的顶级人工智能竞赛,并且首先开发了一款能够在《星际争霸2》击败内置AI的代理商。

在今年4月举行的Qualcomm人工智能开放日,高通公司宣布将与腾讯AI实验室,King Glory和vivo共同创建一个王者荣耀AI电子竞技团队“SUPEX”,希望通过MOBA的实验环境游戏场景。不断改进和优化AI电子竞技团队的实力,从而为移动电子竞技带来更好的竞争体验。

腾讯副总裁姚星表示,“电子竞技”将成为短期内战略合作AI“启蒙”的主要应用场景。

作为数字时代最受欢迎的运动,电子竞技已成为2018年亚运会的表演活动,中国队获得两枚金牌和一枚银牌。

与传统体育一样,电子竞技专业球员也需要手眼协调,对战略和运营的快速反应,团队合作以及大量的艰苦训练。

凭借其在算法和数据方面的优势,AI为专业玩家提供有关数据,战略和协作以及不同级别和级别的专业陪练的实时分析和建议。过去,随着推动电子竞技专业发展的技术,人工智能将继续推动中国的电子竞技走在世界前列。

此前,芷芝有一系列有关全球人工智能与人类之间战争的报道。

DeepMind:

让人们感到羞耻的DeepMind:它实际上是谷歌的一大包!

OpenAI命中Dota2:

人类被打败了! OpenAI击败Dota2半职业球员

OpenAI密封了与人类Dota2冠军的战斗! 2: 0胜,艰苦训练10月比人类早45,000岁

Facebook的:

AI为人类争取新的里程碑!打6人赢得世界冠军,学习成本仅为1000元

image.php?url=0Mp9IEht6V

结论:解决一般人工智能的关键步骤

腾讯表示,从长期应用来看,“启蒙”将是腾讯克服人工智能,人工智能的终极研究问题的关键一步。

AGI代表了AI的开发,它可以在通用系统中执行各种复杂命令,以满足或超过人类水平。

从“优秀艺术”到“启蒙”,腾讯人工智能实验室继续让人工智能学习从0到1的进化,并开发出合理的行为模式。

从长远来看,这种研发经验,方法和结论有望在广泛的领域展现出巨大的潜力,例如探索人工智能,结合电子竞技,医疗,制造,无人驾驶,农业和智慧城市管理。

这两种技术水平测试的结果反映了腾讯在深度强化学习和多智能体决策智能方面的国际AI研究水平。这也标志着腾讯在解决一般人工智能问题方面的进一步努力。

腾讯人工智能实验室将通过论文和其他形式进一步分享技术细节,并通过开放式研究帮助和激励更多的研究人员。

本文为第一作者的原创,未经授权不得转载

收集报告投诉