加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

南京大学教授俞扬:走出游戏世界的强化学习

发布时间:2020-12-24 18:55:30 所属栏目:业界 来源:网易科技) 更多精彩内容,请关注《预见未来十年!2020网易
导读:南京大学教授俞扬:走出游戏世界的强化学习 (来源:网易科技) 更多精彩内容,请关注《预见未来十年!2020网易未来大会》专题报道 杭州网讯12月18日-20日,2020网易未来大会在杭州盛大举行。大会以“洞觉未见”为主题,汇聚了全球最强大脑,期盼以远见超越

还有其他的状况,其实我们觉得很大程度上,比如说自动驾驶,我们觉得自动驾驶在今天还是比较困难,困难在哪里?不是因为车难开,而是因为它面临动态不确定的环境。比如这是我们拍摄的人怎么过马路,就是街上的动态参与者的环境,所以动态参与者才是自动驾驶最大的麻烦。有了这些数据以后,我们可以还原出虚拟的人在马路上怎么走。有了这样的场景,我们可以训练一下,这里面每个能看到周围,而且根据周围情况进行反应。这种情况下,我们可以训练车怎么能够成功通过一个人群,特别是我们有很多这样的场景以后,很多很难在真实情况下被发现的corner case,在这种情况下就能被发现出来。比如这是在做加塞,在今天的道路上如果不能加塞,如果我们要通过拥挤的交通,就没有办法真正上路。

我做一个总结。我们来看决策这件事情,以往最开始的决策是人想好怎么做,然后告诉机器该怎么做,机器只是复制了我们的想法。更高级一点的程度,那就是我们做一个虚拟的环境,我们把问题抽象出来,然后要机器解决问题。但是这里面需要有人来做真实问题的抽象。另外一边是做推荐,以往可能是通过预测的方法,比如我们看什么样的东西好卖,就把它放在前面。但是不是好卖的东西放在前面就好卖?不一定,所以预测和决策之间脱节,这个脱节需要有专家把它连上。直到最后一种方案,我们可以从数据自动还原虚拟环境,并且可以在虚拟环境里面自动做决策。

这个过程和前面几个过程相比最大的不同,就是人可以不在环境里面,技术路线全部走通以后就可以实现机器自主决策。我们也期待未来能走到真正的通用的人工智能道路上,谢谢大家!

2020网易未来大会由杭州市人民政府和网易公司联合主办,杭州市商务局、杭州市经济和信息化局、杭州市滨江区人民政府、北京网易传媒有限公司以及网易(杭州)网络有限公司承办,中国移动总冠名。大会将进行三天的头脑风暴、涵盖了预见未来、新基建、人工智能、区块链、潮商业、UP生活以及和文化等论坛。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读