45、激活函数 - 为什么非线性这么重要

阅读量：

本节讨论了神经网络中非线性的必要性和作用。通过分析多个线性关系叠加仍为线性关系的事实，解释了卷积算法作为线性操作可能导致模型退化为简单线性模型的局限。因此，在神经网络中引入非线性因素（如激活函数）至关重要。文章提到在卷积层后通常会增加非线性的激活层（如ReLU），以使模型能够处理复杂的任务并避免数学上的局限。

在本节中,我们将深入探讨神经网络中的激活函数这一核心概念.在此之前,请先了解非线性这一基本概念.

看一个基础知识：** 线性函数的叠加，我们初中学过的知识点** 。

考虑一个线性函数 $y = kx + b$ 的形式，在其图像中可观察到变量间的关系结构。该函数的图像呈现为下述形式：一条直线。这表明变量 $y$ 与变量 $x$ 之间呈现线性关系。

当存在另一个数学表达式 $z = hy + d$ 时，则可以通过如下所述的线性转换使得变量 $z$ 和 $x$ 同样呈现出数学表达式的关系。

z = hy + d

= z(kx + b) + d

= zk x + zb + d

= zk(x) + (zb + d)

令 zk = K， zb + d = B，那么 z 和 x 的关系就可以写出 z = Kx + B

所以，z 和 x 同样是线性关系。

这里想说明的一个原理是：多个线性关系的叠加作用，在叠加之后的结果仍然是属于线性空间的；换句话说，在叠加作用下，它无法成为非线性的。

在神经网络领域中，在我们了解深度学习模型时会遇到卷积操作这一重要概念。其核心计算机制可由以下数学表达式表示： $y = x * w$ （其中x代表输入数据,w为权重参数）。值得注意的是，在这个过程中, 符号*标识卷积操作的作用方式。

那么x * w 是线性关系还是非线性关系呢？不好意思，就是线性关系。

由于卷积的核心计算采用的是乘累加方式 $...$ 这一概念在之前的讨论中反复强调 $...$ 由此可知，卷积算法具有线性特性。

假设神经网络是由一系列的卷积运算依次堆叠而成。若未引入必要的非线性激活函数，在数学建模的过程中，这样的深度堆叠将无法维持复杂的特征提取能力。从而使得多层卷积架构变得毫无价值。

层数再多也没用，因为数学上等价于一个卷积，看下图解释的更清楚一些。

这就是原因所在。

鉴于此，在现代深度学习框架中常见的神经网络架构都必须引入非线性的数学特性以实现对任何可能的复杂动态行为的精确建模和预测分析。

通过该模型可以实现复杂的任务处理，并无需担心其仅仅是基于线性假设的简单数学模型。

怎么引入非线性因素呢？

在卷积层之后普遍采用添加非线性激活层的方法，在许多卷积算法设计中常见做法就是采用relu函数作为激活函数的选择原因

由于 relu 函数属于非线性函数的一种，在下文将详细介绍该函数的具体特性与应用。在此章节中，请理解并掌握神经网络为何需要使用非线性和其重要性就可。

全部评论 (0)

还没有任何评论哟~

45、激活函数 - 为什么非线性这么重要

这一节开始讲一讲神经网络中的激活函数，在讲激活函数之前，先讲一下非线性。看一个基础知识：线性函数的叠加，我们初中学过的知识点。假设有一个线性函数，y=kx+b,这个函数画出来是下面的样子，这里显示...

为什么要使用非线性函数作为激活函数？

在神经网络中，使用非线性函数作为激活函数是非常重要的，因为它们赋予了神经网络表示和学习更复杂、更强大的能力。以下是一些主要原因： 1. 引入非线性特性：如果在神经网络中使用线性激活函数，那么整个网络将...

为什么引入非线性激励函数？

文章目录一、非线性激励函数二、为什么引入非线性激励函数？一、非线性激励函数非线性激活函数在深度学习中起到引入非线性变换的作用，使得神经网络能够学习更复杂的函数关系。

为什么要使用激活函数,激活函数的作用

目录 1.如果没有激活函数会怎么样？ 2.所以需要对线性输出做非线变换激活函数的作用:激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。 3.常见的激活函数 3.1.Sigmoid函数 3...

深度学习学习笔记——C1W3-7——为什么需要使用非线性激活函数？

WhydoyouneedNonLinearActivationFunctions?为什么需要使用非线性激活函数？ Whydoesaneuralnetworkneedanonlinearactivati...

神经网络为什么要使用激活函数，为什么relu要比sigmoid要好

第一个问题：为什么引入非线性激励函数？如果不用激励函数（其实相当于激励函数是fx=x），在这种情况下你每一层输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与...

为什么神经网络需要激活函数层？

这个问题的原因，很多教材上讲是为了引入非线性，也就是说只有引入激活函数层建立的网络才具有非线性特征，那疑问就来了，没有激活函数层就没有非线性了吗？如果答案是肯定的话，是否存在严谨的理论证明？以为下面...

深度学习笔记（7）：几种常见的激活函数介绍，以及为什么必须要使用非线性函数作为激活函数

当前主流的激活函数主要有四种 ReLU 线性整流函数（RectifiedLinearUnit,ReLU），又称修正线性单元，是一种人工神经网络中常用的激活函数（activationfunction），...

卷积神经网络基础题——为什么要添加非线性的激活函数，线性的会如何？

卷积神经网络基础为什么要添加非线性的激活函数，线性的会如何？答：如果使用线性激活函数，那么无论神经网络中有多少层，都只是在做线性运算，最后一层得到的结果是输入层的线性组合，而输入层的线性组合，用一...

非线性激活函数

几种非线性激活函数介绍 1\.几种非线性激励函数ActivationFunction 神经网络中，正向计算时，激励函数对输入数据进行调整，反向梯度损失。梯度消失需要很多方式去进行规避。

是否确定退出登录?

45、激活函数 - 为什么非线性这么重要

怎么引入非线性因素呢？

全部评论 (0)

相关文章推荐

45、激活函数 - 为什么非线性这么重要

为什么要使用非线性函数作为激活函数？

为什么引入非线性激励函数？

为什么要使用激活函数,激活函数的作用

深度学习学习笔记——C1W3-7——为什么需要使用非线性激活函数？

神经网络为什么要使用激活函数，为什么relu要比sigmoid要好

为什么神经网络需要激活函数层？

深度学习笔记（7）：几种常见的激活函数介绍，以及为什么必须要使用非线性函数作为激活函数

卷积神经网络基础题——为什么要添加非线性的激活函数，线性的会如何？

非线性激活函数