加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

4 分钟!OpenAI 的机器手学会单手解魔方了,完全自学无需编程

发布时间:2019-10-17 06:39:24 所属栏目:建站 来源:佚名
导读:OpenAI 的机器手学会单手解魔方了,而且还原一个三阶魔方全程只花了 4 分钟,其灵巧程度让人自叹不如。 给你一个魔方,只允许使用一只手,还时不时有人给你捣乱,你能在 4 分钟内还原它吗?我不能,两只手都不行。 OpenAI 的仿人机器手 Dactyl 做到了。现

我们认为,元学习,或 learning to learn,是构建通用系统的一个重要前提,因为元学习使它们能够快速适应环境中不断变化的条件。ADR 背后的假设是,一个记忆增强网络与一个充分随机化的环境相结合,导致了 emergent meta-learning,其中网络实现了一个学习算法,允许自己快速调整其行为以适应其所部署的环境。

为了系统地测试这一点,我们测量了神经网络在不同的扰动下(如重新设置网络的内存、重新设置动态、或断开一个关节)每次翻转魔方(旋转魔方使不同颜色的面朝上)成功的时间。我们在仿真环境进行这些实验,这使我们能够在一个受控的环境中进行超过 10000 次的性能测试。

4 分钟!OpenAI 的机器手学会单手解魔方了,完全自学无需编程

一开始,随着神经网络成功地完成更多的翻转,每次连续成功的时间都在减少,因为神经网络学会了适应。当施加干扰时(上图中垂直的灰色线条),我们看到了成功时间的一个峰值。这是因为网络采用的策略在变化的环境中不起作用。然后,网络重新学习新的环境,我们再次看到成功的时间减少到先前的基线。

下图是机器手在模拟环境中解魔方的可视化。

4 分钟!OpenAI 的机器手学会单手解魔方了,完全自学无需编程

我们使用可解释性工具箱中的一个构件,即非负矩阵分解,将这个高维向量压缩成 6 组,并为每组分配一个独特的颜色。然后在每一步中显示当前主导组的颜色。

二、为什么说转个魔方就称得上实现了机器人技术的飞跃?

实际上会玩魔方的机器人并不只有 Dactyl 一个。那些专门被设计用来解魔方的机器人,甚至可以比 Dactyl 更快地处理三阶、甚至更高阶的魔方,那么为什么只有 Dactyl 获得如此高的评价呢?

OpenAI 的研究科学家和机器人技术负责人彼得·韦林德(Peter Welinder)认为,原因就在于 Dactyl 不是专门用来玩魔方的!玩魔方只是一个 demo,而 Dactyl 最大的亮点在于“自学习”!

目前人工智能机器人之所以能够在特定场景下超越人类,因为它是针对这个特定任务进行不断的微调和优化后的结果,通过编程来尽可能高效地执行任务。但跳出机器人的“舒适区”后,它可能连人类的婴儿都不如。

人工智能和机器人行业一直希望达成这样的目标:制造一个机器人,它可以自己学会处理各种现实世界中的实际任务,而无需经过长时间的训练或者有针对性的编程。是 Dactyl 让他们看到了曙光!

Dactyl 拥有“自学习”特性,这意味着它能够自动适应各种场景。OpenAI 希望有一天,只存在科幻电影里的经典机器人角色,能够走出荧幕,走进千家万户,为人类提供服务。

OpenAI 团队认为,Dactyl 此次成功解决魔方任务也印证了其可以在处理实际问题之前,通过仿真训练学习新任务。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读