8.反向传播Backpropagation

阅读量：

1 前言

1.1 为什么要用 Backpropagation

在神经网络中的梯度下降算法和之前求线性回归方程中用的没有太大的区别，都是不断的计算微分，然后更新参数，最终找到一个最优解。

但是在神经网络中，有着大量可能多达上百万个的参数，所以传统的求微分方法行不通，计算量太大无法快速有效的求出微分。

1.2 链式求导法则（Chain Rule）

**** Backprogation 中设计的最重要的数学知识就是 chain rule，通过下面的图片回顾一下。

2 .Backpropagation

2.1 应该求什么

从上一节内容我们知道，每一个神经网络都需要定义一个 Loss Function , 用来定义实际输出与预期输出之间的误差 Cn ，则总的误差就是

我们的目的就是要使上式的值最小。用 Gradient descent 来做的话就是这个式子对权值 w 求偏导，即

由此我们知道只需要求每个 Cn 对 w 的偏导，然后全部加起来就可以了。

2.2 Forward pass

对上面这个 Neural 来说，根据 Chain Rule，

很明显，计算 ∂z/∂w 是很容易的，如在上图中，∂z/∂w1=x1,∂z/∂w2=x2 ,即，∂z/∂w 就等于其所在边的输入。

2.3 Backward pass

所以我们剩下的问题是计算 ∂C/∂z，但是我们没办法直接算这个偏导，所以又要再做变换了。

由上图可知，

其中，a=σ(z)，所以 ∂a/∂z=∂σ(z)/∂z=σ'(z) .于是我们剩下的任务就是求 ∂C/∂a ,根据上图的公式我们知道剩下要求的就是和∂C/∂z‘和∂C/∂z′′ 。接下来，我们假设∂C/∂z′和∂C/∂z′′ 是已知的（通过某些神奇的方法算出来了），于是将上述的东西凑起来，我们就可以算出

从另一观点看待下面的式子：有另外一个neuron（下图中的大三角形，表示乘法/放大器），input是∂C/∂z′与∂C/∂z′′ ，权重分别是w3,w4，求和经过neuron（乘以σ′(z)），得到 ∂C/∂z。

现在的问题是，如何计算∂C/∂z′ 与∂C/∂z′′ 。第一种情况，z′,z′′ 所接的neuron是output layer的neuron,如下图

我们发现，图中的公式是可以计算的（看不出来就多看几遍，再看不出来就假装已经看出来了），于是我们把所有要求的都求出来了,就可以计算微分值了。但是，如果下一层不是输出层呢？这就是下面的第二种情况，那就把问题继续往下一层传递，直到输出层，然后就可以从最后一层一直往前计算回来了。如下图，相当于把输出作为输入，建立一个反向的神经网络。

从输出层开始，从右往左反向传播，最终求得∂C/∂z1和∂C/∂z2。例如(∂C/∂z5权重w +∂C/∂z6权重w)σ'(z3)=∂C/∂z3,(∂C/∂z5权重w +∂C/∂z6*权重w)*σ'(z4)=∂C/∂z4递归往前传

3. 总结

所以，Backpropagation 算法的流程就是：

**** a)Forward Pass**：** 算出每一层的输出 a，也就是 ∂z/∂w .

b) Backward Pass**：** 反转神经网络，从输出层往回计算每一层的 ∂C/∂z.

c) 将前面算出来的两项相乘，得到 ∂C/∂w.

对我来说，我觉得把这个算法过程当成是一次递归就会很好理解，Forward Pass 就是函数一层层的调用，达到返回条件（在BackPropagation中是遇到输出层）就开始返回，也就是 Backward Pass.

全部评论 (0)

还没有任何评论哟~

8.反向传播Backpropagation

1前言 1.1为什么要用Backpropagation 在神经网络中的梯度下降算法和之前求线性回归方程中用的没有太大的区别，都是不断的计算微分，然后更新参数，最终找到一个最优解。但是在神经网络中，有...

反向传播算法（backpropagation）

算法简介百度百科： BP算法即反向传播算法适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n...

反向传播算法（BackPropagation，BP）

在一个多层的神经网络中，反向传播算法就是不断的学习这个网络的权值和偏值，采用梯度下降法使得该神经网络的输出值与真实的目标值之间的误差最小。 1，那么为什么更新权值和偏值可以使得代价函数最小化呢？2，以...

13、反向传播和MLP(Backpropagation & MLP)

Inthislesson,wediveintobackpropagationandthecreationofasimpleMultiLayerPerceptronMLPneuralnetwork.We...

【AI知识点】反向传播（Backpropagation）

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】反向传播（Backpropagation）是训练神经网络的核心算法，它通过反向逐层计算损失函数对每个权重的梯度，来反向逐层更新网络的权重，...

[Deep Learning] 反向传播算法（Backpropagation Algorithm）

ChainRule（链式法则） Case1 如果有： y=gxz=hyy=gx\\\\\\z=hy 那么“变量影响链”就有： Δx→ΔyΔz\Deltax\rightarrow\Deltay\Delt...

深入浅出反向传播原理 Backpropagation

前述在深度学习中，我们的训练模型是一个多层次的神经网络，每个节点对应一个激活函数，上一个Layer的输出就是下一个Layer的输入。这样的模型，非常像复合函数层层的依赖关系：可以把第一层Layer想...

反向传播算法之要点(Backpropagation Algorithm)

反向传播算法之要点BackpropagationAlgorithm Introduction 反向传播是一个很简单的算法，一个学习过微积分的人就能够轻松的理解。本文希望能避免让人打不起精神来看的冗余繁...

反向传播(BackPropagation)与梯度下降(Gradient Descent)

梯度下降算法GradientDescent 在机器学习的模型的训练阶段，对模型反复做的事情就是将训练样本通过模型计算出的结果与实际训练集的标签进行比对，用以修改模型中的参数，直至模型的计算结果与训练集...

通俗解释反向传播（Backpropagation）的计算

Backpropagation算法是目前绝大多数神经网络在优化参数时用到的算法，具有快速方便容易实现的优点。那么它是如何实现的呢？首先看一张典型神经网络结构图：上图是一个包含了输入层L1、一个隐含...

是否确定退出登录?

8.反向传播Backpropagation

1 前言

2 .Backpropagation

3. 总结

全部评论 (0)

相关文章推荐

8.反向传播Backpropagation

反向传播算法（backpropagation）

反向传播算法（BackPropagation，BP）

13、反向传播和MLP(Backpropagation & MLP)

【AI知识点】反向传播（Backpropagation）

[Deep Learning] 反向传播算法（Backpropagation Algorithm）

深入浅出反向传播原理 Backpropagation

反向传播算法之要点(Backpropagation Algorithm)

反向传播(BackPropagation)与梯度下降(Gradient Descent)

通俗解释反向传播（Backpropagation）的计算