Advertisement

人工智能——神经网络

阅读量:

一、人工智能发展简史
1950年,英国科学家艾伦图灵发表了论文讨论创造出具有真正智能的机器的可能性,并提出了著名的图灵测试:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。现在活跃于电脑,手机,还有各种硬件上的“智能助手”在各自的功能领域,通常被大众认为挺有智能的。
从1956年的达特茅斯会议开始,人工智能(Artificial Intelligence,AI)作为一个专门的研究领域出现,经历了超过半个世纪的起伏,终于在2007年前后,迎来了又一次大发展。
在这里插入图片描述
二、人工智能的定义
要实现某种狭义的人工智能,我们很自然地想到,如果我们能让运行程序的电脑来学习并自动掌握某些规律,那该多好啊,这就是“机器学习”。机器学习在几十年的发展历史中,产生了很多技术。
机器学习大致可分为三种类型:无监督学习,监督学习,强化学习。如果我们把机器学习当作一个小孩,那么,教育小孩的方式就有根据正确答案指导学习(监督学习);根据小孩实践的过程给予各种鼓励(强化学习);还有自由探索世界,让小孩自己总结规律(无监督学习)。
机器学习领域出现了各种模型,其中,神经网络模型是一个重要的方法,它的原型在1943就出现了,在生物神经网络中,每个神经元与其他神经元相连,当它兴奋时,就会像相邻的神经元发送化学物质,从而改变这些神经元内的电位;如果某神经元的电位超过了一个阈值,那么它就会被激活(兴奋),向其他神经元发送化学物质。把许多这样的神经元按照一定的层次结构连接起来,我们就构建了一个神经网络。
神经网络结构图
三、神经网络的基本工作原理简介

1-神经元细胞的数学模型
输入 input
(x1, x2, x3)(x1, x2,x3) 是外界输入信号,一般是一个训练数据样本的多个属性,(x1,x2,x3) 分别代表了(红,绿,蓝)三种颜色,而此神经元用于识别输入的信号是暖色还是冷色。
权重 weights
(w1,w2,w3) 是每个输入信号的权重值,以上面的 (x1,x2,x3)的例子来说,x1的权重可能是 0.92,x2的权重可能是 0.2,x3的权重可能是 0.03。当然权重值相加之后可以不是 1。
偏移bias
还有个 b 是怎么来的?一般的书或者博客上会告诉你那是因为 y=wx+by,b 是偏移值,使得直线能够沿 Y轴上下移动。
从生物学上解释,在脑神经细胞中,一定是输入信号的电平/电流大于某个临界值时,神经元细胞才会处于兴奋状态,这个 b 实际就是那个临界值。亦即当:在这里插入图片描述
时,该神经元细胞才会兴奋。我们把t挪到等式左侧来,变成(−t),然后把它写成 b,变成了:
在这里插入图片描述
2 - 神经网络的训练过程
单层神经网络模型
在这里插入图片描述
训练流程
在这里插入图片描述
三、神经网络的三大概念:反向传播,梯度下降,损失函数
1、反向传播
在这里插入图片描述
正向过程
第1个人,输入层,随机输入第一个 x值,x 的取值范围 (1,10](1,10],假设第一个数是 22;
第2个人,第一层网络计算,接收第1个人传入 x 的值,计算:a=x^2a;
第3个人,第二层网络计算,接收第2个人传入 a 的值,计算:b=ln (a)b;
第4个人,第三层网络计算,接收第3个人传入 b 的值,计算:c=sqrt{b};
第5个人,输出层,接收第4个人传入 c 的值
在这里插入图片描述
2、梯度下降
梯度下降数学公式:
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
3、损失函数
“损失”就是所有样本的“误差”的总和,亦即(mm 为样本数):
在这里插入图片描述
在这里插入图片描述

五、总结
神经网络可以计算任何函数
“神经网络可以计算任何函数”的真正含义:
1)不是说一个网络可以被用来准确地计算任何函数,而是我们可以获得尽可能好的一个近似。通过增加隐层神经元的数量,可以提升近似的精度。
2)可以按照上面的方式近似的函数类其实是连续函数。如果函数不是连续的,也就是会有突然、极陡的跳跃,那么一般来说无法使用一个神经网络进行近似。
总而言之:包含一个隐层的神经网络可以被用来按照任意给定的精度近似任何连续函数。

全部评论 (0)

还没有任何评论哟~