加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 电商 > 正文

NeurIPS 2018网易推出强化编程框架

发布时间:2018-12-07 09:14:34 所属栏目:电商 来源:新智元
导读:(原标题:NeurIPS 2018网易推出强化编程框架,一文解读如何帮RL落地产业) 【新智元导读】人工智能顶会NeurIPS 2018正在如火如荼的进行着,并且首次在第一天增加了Expo Workshop。一共有十家公司有幸拿到了组织workshop的机会,其中中国有四家,分别是阿

最终实验结果显示:蓝色线条为端到端的模型,效果最差;红色为网络加规则的混合模型一开始上升很快,且始终优于蓝色;绿色线条为分层模型,最初低于红色,但在后续训练过程中逐渐变成收益最高的一条曲线。验证了复杂问题中引入人工经验进行混合编程与问题分解进行分层网络训练的优势。

NeurIPS 2018网易推出强化编程框架,一文解读如何帮RL落地产业实验结果对比

在过去的一年多时间里,伏羲实验室已经利用该框架将深度强化学习应用于游戏产业。目前已在网易的多款自研产品中取得成果并上线,涵盖MMORPG、篮球、动作及休闲等众多品类。比如在潮人篮球这款游戏中,3V3模式3个AI Bot胜率达82%,2个AI与1个玩家人机合作胜率达70%。

网易伏羲实验室

网易伏羲实验室是国内首家专业游戏AI研究机构,成立于2017年9月,目前已有160名成员。实验室在强化学习、自然语言处理、计算机视觉和虚拟人等方向开展学术研究及产业落地尝试。愿景是“以人工智能技术点亮游戏未来”,希望运用人工智能的尖端技术为玩家营造新世代的游戏体验,同时借助游戏平台的海量数据和仿真环境,推动人工智能技术发展。

在本届NeurIPS Expo研讨会上,伏羲实验室提出了一种新的强化编程框架,能够让没有任何强化学习背景知识的使用者也能将这项技术应用到现实问题,促进强化学习在产业界落地。该框架是对传统编程的增强,使用者能够以调用一种可学习函数的方式使用强化学习,方便的实现逻辑规则与强化学习的混合编程及多网络协同学习,该框架还提供了可视化的流程图前端工具和集成各种算法的后端云平台,能够更加快捷地实现上述编程模式。此外,很多后续工作也在进行,如集成AutoML、支持模仿学习等。

在该框架的工作中,南京大学LAMDA实验室的俞扬教授团队与伏羲团队建立了合作,并计划将该框架用于星际AI和基于环境建模的模仿学习研究中。该框架已经在多款网易的游戏中应用,并计划和氪信科技一起将其推广到金融领域。网易方面表示,希望这套强化编程框架不断改进变得更加通用,让强化学习技术更快的在产业应用中发挥价值,未来帮助用户解决更多实际问题。同时也欢迎各界积极交流、探讨,共同推进AI技术发展。

姚立伟 本文来源:新智元 责任编辑:姚立伟_NT6056

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读