加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

腾讯AI击败王者荣耀职业队,全靠自学,一天训练量为人类440年

发布时间:2019-08-05 13:34:05 所属栏目:建站 来源:问耕
导读:本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 王者峡谷,风云突变。 一场激烈的对战正在进行,左侧是五位人类职业电竞高手组成的赛区联队,另一方是嗯?他们的对手没有出场?五个座椅空空荡荡? 不。他们的对手都在。 这是昨晚的吉

腾讯绝悟:网络解码不需要太大资源,正常服务器即可。1v1版本已经有手机版本,目前在ChinaJoy对顶尖选手开放测试。

腾讯AI击败王者荣耀职业队,全靠自学,一天训练量为人类440年

量子位:绝悟有什么弱点?有什么还没玩家被解决的问题?

腾讯绝悟:有些我们不会称为弱点,但很有意思的行为。

比如在此次测试中,最后不推水晶,要奖励最大化?赛事尾声,人类赛区联队团灭后,绝悟并未直接推水晶,而是在计算整体收益后,选择先推完最后一个高地塔,再推水晶直至胜利。这是人类一般不会做的事情,但这符合 AI 的价值观设定,就是最大化经济效益。

量子位:人类对手,尤其是职业玩家怎么评价绝悟?

腾讯绝悟:前期策略上,很早就多个 AI 抱团,甚至愿意牺牲兵线,换取血量优势;中期超强的兵线运营策略;长期策略是一直保持游戏主动权;团战的目标选择和控制衔接也很完美,体现了很强的团队协作能力。

量子位:团队介绍一下吧。

腾讯绝悟:是长期致力于游戏AI和多智能体研究的团队,部分成员来自围棋AI绝艺的团队。

绝悟的研发是算法+算力高度结合,需要极致优化的算力平台和持续改进的优化算法,团队综合了AI Lab的科研与工程人才资源,还联合了我们所在的腾讯技术与工程事业部(TEG)旗下基础架构平台部人才。主要工作包括模型、特征、算力、数据的优化,机器虚拟化、搭建和优化数据处理、并行计算和机器学习训练的平台。

腾讯AI Lab一直是此类智能体研究的先行者。2016年起,研发的围棋AI绝艺(Fine Art),现担任中国国家围棋队训练专用AI;2017年,启动绝悟研发;2018 年,绝悟达到业余顶尖水平,腾讯还在射击类顶级 AI 竞赛VizDoom夺冠,并在《星际争霸2》首先研发出击败内置AI的智能体。

量子位:普通人怎么能和绝悟交手?

腾讯绝悟:目前绝悟只是实验阶段,没有在游戏内开放。

1v1版本在特定场合会做非常短期的测试,比如8月2日起在上海举办的国际数码互动娱乐展览会ChinaJoy,1v1版本会向顶级业余玩家开放为期四天的体验测试。

绝悟之路

绝悟,是腾讯AI Lab和与王者荣耀共同探索的前沿研究项目:策略协作型AI。

绝悟这个名字,寓意“绝佳领悟力”。这个AI的研发始于2017年12月。2018年12月,绝悟5v5对阵《王者荣耀》王者段位人类玩家,大战250局,拿下48%的胜率。现在,绝悟已经超越王者段位水准,达到职业电竞选手的层次。

这次在吉隆坡和上海发威的绝悟版本,建立了基于“观察-行动-奖励”的深度强化学习模型,无需人类数据,从白板学习(Tabula Rasa)开始,让AI自己与自己对战。

AI一天的训练强度高达人类440年。

腾讯AI击败王者荣耀职业队,全靠自学,一天训练量为人类440年

据腾讯介绍,AI从0到1摸索成功经验,勤学苦练,既学会了如何站位、打野、辅助保护和躲避伤害等游戏常识。而且,AI还探索出了不同于人类常规做法的全新策略。在上面的对战实况中,我们已经可以感受到绝悟的不同之处。

绝悟的研发团队还创建One Model模型提升训练效率,优化通信效率提升AI的团队协作能力,使用零和奖惩机制让AI能最大化团队利益,使其打法果断,有舍有得。

游戏中测试的难点,是AI要在不完全信息、高度复杂度的情况作出复杂快速的决策。

在庞大且信息不完备的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,这带来了极为复杂的局面,预计有高达1020000种操作可能性,而整个宇宙原子总数也只是1080

如果AI能在如此复杂的环境中,学会人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。

腾讯副总裁姚星表示,“电子竞技”将成为策略协作型AI“绝悟”未来短期内的主要应用场景。而长期应用上,绝悟将是腾讯攻克通用人工智能(AGI)的关键一步。

此前,腾讯另一个AI绝艺,在围棋赛场上大杀四方。当然对人工智能来说,王者荣耀是一个比围棋复杂太多的难题。

腾讯AI击败王者荣耀职业队,全靠自学,一天训练量为人类440年

绝悟背后的技术

对于这次的绝悟,腾讯AI Lab表示将通过论文等形式进一步分享技术细节,通过开放研究,帮助和启发更多研究者。

在这我们回顾一下腾讯此前发布了一篇关于王者荣耀的论文。在这篇论文中,腾讯表示绝悟是一个基于学习的分层宏观策略(Hierarchical Macro Strategy)模型。经过这个模型的熏陶,控制每个英雄的智能体就既能独立做出决策又不忘与队友沟通,成为顶尖选手。

名字里的“分层”,指的是这个模型分为注意力层(Attention Layer)和时期层(Phase layer),前者用来预测英雄该去哪儿,后者负责识别游戏进行到了什么阶段,是前期、对线还是后期。

腾讯AI击败王者荣耀职业队,全靠自学,一天训练量为人类440年

我们先看注意力层,也就是AI怎样判断它的英雄该去哪儿。

培养这项能力,首先要有合适的训练数据,而在王者荣耀里,想判断英雄“到了这儿”,最合适的标准莫过于“在这儿打起来了”。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读