Python与人工神经网络:使用神经网络识别手写图像介绍

2020-02-16 11:10:09

字体：大中小

来源：转载

供稿：网友

人体的视觉系统是一个相当神奇的存在，对于下面的一串手写图像，可以毫不费力的识别出他们是504192，轻松到让人都忘记了其实这是一个复杂的工作。

实际上在我们的大脑的左脑和右脑的皮层都有一个第一视觉区域，叫做V1，里面有14亿视觉神经元。而且，在我们识别上面的图像的时候，工作的不止有V1，还有V2、V3、V4、V5，所以这么一看，我们确实威武。

但是让计算机进行模式识别，就比较复杂了，主要困难在于我们如何给计算机描述一个数字9在图像上应该是怎样的，比如我们跟计算机说，9的上面是一个圈，下右边是1竖。然而有的人写9会带勾，有的人还会在圈周围多出点什么，总的来说，这种描述法太容易出现其他状况。况且，我们这里讨论的还只是数字，涉及到字母、汉字、符号就回更复杂。

于是人们就有了另外一种途径，那就是我们不用告诉计算机什么是9，我们可以把他当作一个小孩子，让他见很多9的图片，对他说，这是9，记得哈。慢慢的他就形成了自己的评判标准，等他长大了，自然就知道以后遇到的图片是不是9了。让我们人学习的方式是见闻，让计算机学习的就是给他数据，这个数据通常被叫做训练样本（如图），而这套学习的方法，就是神经网络了。

感知机（Perceptrons）

在说人工神经网络之前，我们先说另外一个人工神经元系统，叫感知机（Perceptrons）。感知机模型是这样的：

其中x1，x2，x3是二进制的输入值，output是二进制的输出值。在每个输入端，还会有一个权重，w1，w2，w3。output取决于x1*w1+x2*w2+x3*w3，如果他小于等于一个临界值的时候，output就输出0，大于等于那个临界值的时候，output就输出1。当然输入值可以是任意多个，用公式表示就是：

output={01if ∑jwjxj≤ thresholdif ∑jwjxj> threshold