加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

奶爸为8岁女儿解读深度学习篇之:11个事实

发布时间:2019-08-22 09:11:06 所属栏目:移动互联 来源:机器之心编译
导读:「神经网络就像数数一样简单」,「卷积层只是一个蝙蝠信号灯」在本文中,一位奶爸从手写数字识别入手,用这样简单的语言向自己 8 岁的女儿解释了一下「深度学习」。当然,用这篇文章向女朋友(如果有的话)科普自己的工作也是可以的。 机器学习,尤其是深
副标题[/!--empirenews.page--]

「神经网络就像数数一样简单」,「卷积层只是一个蝙蝠信号灯」……在本文中,一位奶爸从手写数字识别入手,用这样简单的语言向自己 8 岁的女儿解释了一下「深度学习」。当然,用这篇文章向女朋友(如果有的话)科普自己的工作也是可以的。

奶爸为8岁女儿解读深度学习篇之:11个事实

机器学习,尤其是深度学习是一个热门话题,你肯定会在媒体上看到流行语「人工智能」。

然而,这些并非新概念。第一个人工神经网络(ANN)是在 40 年代引入的。那么为什么最近的热点话题都是关于神经网络和深度学习的呢?我们将在 GPU 和机器学习的一系列博客文章中探讨这些概念。

奶爸为8岁女儿解读深度学习篇之:11个事实

在 80 年代,我记得我父亲构建了用于银行支票的字符识别工具。检查这么多不同类型的笔迹真的是一件痛苦的事,因为他需要一个方程来适应所有的变化。

在过去几年中,很明显,处理这类问题的最佳方法是通过卷积神经网络。人类设计的方程不再适合处理无限的手写模式。

让我们来看看最经典的例子之一:构建一个数字识别系统,一个识别手写数字的神经网络。

事实 1:神经网络就像数数一样简单

我们首先计算最上面一行的红色形状在每个黑色手写数字中出现了几次。

奶爸为8岁女儿解读深度学习篇之:11个事实

手写数字的简化矩阵

现在让我们尝试通过计算具有相同红色形状的匹配数来识别(推断)新的手写数字。然后我们将其与之前的表格进行比较,以确定这个数字与哪个数字有最强的关联:

奶爸为8岁女儿解读深度学习篇之:11个事实

匹配手写数字的形状

恭喜!你刚刚构建了世界上最简单的神经网络系统,用于识别手写数字。

事实 2:图像只是一个矩阵

计算机将图像视为矩阵。一张黑白图像是个 2D 矩阵。

我们来考虑一张图像。为了简单起见,我们拍摄一张数字 8 的小黑白图像,方形尺寸为 28 像素。

矩阵的每个单元表示从 0(表示黑色)到 255(表示纯白色像素)的像素强度。

因此,图像将表示为以下 28×28 的像素矩阵。

奶爸为8岁女儿解读深度学习篇之:11个事实

手写数字 8 的图像和相关的强度矩阵

事实 3:卷积层只是一个蝙蝠信号灯

为了确定图片中显示的图案(此处指手写数字 8),我们将使用一种蝙蝠信号灯/手电筒。在机器学习中,手电筒被称为过滤器(filter)。该过滤器用于执行 Gimp 等常见图像处理软件中用到的经典卷积矩阵计算。

奶爸为8岁女儿解读深度学习篇之:11个事实

过滤器将扫描图片,以便在图像中找到图案,并在匹配成功时触发正反馈。它有点像儿童形状分类盒:三角形过滤器匹配三角形孔,方形过滤器匹配方孔等。

奶爸为8岁女儿解读深度学习篇之:11个事实

图像过滤器像儿童形状分类盒一样工作。

事实 4:过滤器匹配是一项易并行任务

更科学地来讲,图像过滤过程看起来有点像下面的动画。如你所见,过滤器扫描的每个步骤都是相互独立的,这意味着此任务可以高度并行化。

要注意,数十个过滤器将同时运行,因为它们不相互依赖。

奶爸为8岁女儿解读深度学习篇之:11个事实

https://github.com/vdumoulin

事实 5:尽可能多次重复过滤操作(矩阵卷积)

我们刚刚看到,输入图像/矩阵使用多个矩阵卷积进行过滤。

为了提高图像识别的准确率,只需从前一个操作中获取过滤后的图像,然后一次又一次地过滤......

当然,我们过分简化了一些事情,但通常你使用的过滤器越多,按顺序重复这个操作的次数越多,你的结果就越精确。

这就像创建新的抽象层以获得更清晰的对象过滤器描述,从原始过滤器到看起来像边缘、轮子、正方形、立方体等的过滤器......

事实 6:矩阵卷积只是乘、加运算

一图胜千言:下图是使用卷积过滤器(3×3)过滤的源图像(8×8)的简化视图。手电筒(此处为 Sobel Gx 过滤器)的投影提供一个值。

奶爸为8岁女儿解读深度学习篇之:11个事实

应用于输入矩阵的卷积过滤器(Sobel Gx)示例

(来源:https://datascience.stackexchange.com/questions/23183/why-convolutions-always-use-odd-numbers-as-filter-size/23186)

这就是这种方法的神奇之处,简单的矩阵运算是高度并行化的,完全符合通用图形处理单元的用例。

事实 7:需要简化和总结检测到的内容吗?只需使用 max()

我们需要总结过滤器检测到的内容,以便学到概括性的知识。

为此,我们将对先前过滤操作的输出进行采样。

此操作称为池化或下采样,但实际上它是为了减小矩阵的大小。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读