一文读懂卷积神经网络中softmax，softmaxloss, 交叉熵的理解

阅读量：

softmaxloss, 交叉熵损失函数的理解

信息量
- 意义
- 公式
信息熵
- 意义
Kullback-Leibler散度
cross-entropy
数学表达式及其核心作用
在深度学习框架中的应用场景
Softmax损失函数的解析
softmax
总结与反思部分

信息量

意义

用来衡量信息量的大小。

公式

复制代码

    I(x)=−log(P(x))

香农对信息量大小的定义指出：如果某一事件发生的概率越大，则该事件所携带的信息量反而越小；反之，则该事件所携带的信息量越大。由此可知，在这种情况下（即事件发生概率p），信息量I与其发生概率p之间呈反比关系。为了满足这一定义的需求，在数学上我们通常采用对数函数，并在其结果前取其负值后即可实现对信息量I的定义：即在事件发生概率p与对应的自变量范围内（0到1），通过对数运算并取其负值来实现对事件所携带的信息量I进行量化计算。

信息熵

意义

信息熵也被认为是信息熵的平均值或均值（即信息量的平均水平），通常用H(x)表示。
其计算公式与概率论中的期望计算方式一致，
具体为各个事件的信息量与其对应概率的乘积之和。

softmax：应用于分类问题，位于卷积神经网络层的最后一层。
softmax意义：输出输入图片，对应概率最大的类别，以及属于该类别的可能性概率。
softmax作用：将Ｎ分类的问题，转化为一个Ｎ×１维的向量，概率和为１。
softmaxloss：计算预测结果的损失，预测结果与label值越接近，损失越小，反之则越大。
信息熵：衡量获得信息的多少。
交叉熵：刻画两个概率分布之间的距离。
损失函数：可以使用tensorflow给定的损失函数，也可以根据实际应用场景自定义损失函数。
对于相同的神经网络，不同的损失函数会对训练得到的模型产生重要影响。
注：１．训练数据的正确答案符合一个概率分布，神经网络的前向传播结果通过softmax回归变成一个概率分布。然后就可以通过交叉熵来衡量这两个概率分布之间的距离，即softmax loss。
２．交叉熵表征真实的概率分布（训练数据的标签值）和模型预测的概率分布之间的差异，值越小，模型的预测结果越好。
３．刻画的是用模型预测的概率分布表示真实的概率分布的困难程度，值越小，刻画得越好，值越大，刻画得越差。
：你的概率是通过softmax公式得到的，那么cross entropy就是softmax loss。

相对熵（KL散度）

如果有一个共同的随机变量 $X$ 同时遵循两个独立的概率分布P(x)和Q(x)，那么我们可以利用KL散度这一工具来比较这两个概率分布之间的差异性。
公式如下：
$D_{KL}(p||q) = \sum_{i=1}^{n}p(x_{i})log\left(\frac{p(x_{i})}{q(x_{i})}\right)$
其中， $P(x)$ 代表样本的真实概率分布模式，而 $Q(x)$ 则代表基于模型预测的概率分布情况。
例如，在一个分类任务中，当模型用于区分猫、狗和马时（如图像分类），假设真实情况是猫（即 $p(x)=1, q(x)=0$ 的情况），那么 $p([1,0,0])=1$ 表示输入属于猫类；而 $q([0.7,0.2,0.1])= [0.7, 0.2, 0.1]$ 则代表模型对各分类的概率预测结果。
计算过程如下：
$D_{KL}(p||q) = \sum_{i=1}^{n}p(x_{i})log\left(\frac{p(x_{i})}{q(x_{i})}\right) = 1*log\left(\frac{1}{0.7}\right) ≈ 0.36$
可以看出，在这个例子中当 $p([1,0,0])=1$ 时（即输入确实是猫），计算得到的结果表明模型对猫类别的预测较为准确（因为此时 $q(猫)=0.7$ ）。通过持续训练模型参数 $\theta$ 以最小化这一散度值（即让 $q(X)$ 尽可能接近 $p(X)$ ），我们能够提升模型在区分不同类别上的准确性。

交叉熵

公式

$D_{\text{Kullback-Leibler}}(p||q) = \sum\limits p(x_i)\cdot\ln\left(\frac{p(x_i)}{q(x_i)}\right) = \sum\limits p(x_i)\cdot\ln p(x_i) - \sum\limits p(x_i)\cdot\ln q(x_i) = -H(p) + [-\sum\limits p(x_i)\cdot\ln q(x_i)]$

其中， $[- \sum_{i=1}^{n}p(x_{i})logq(x_{i})]$ 即为交叉熵。

前一者， $-H(x)$ 代表信息论中的信息熵这一概念；而后一者则为交叉熵这一指标。两者的差值即为Kullback-Leibler散度。深入理解交叉熵的概念时，请注意其与信息论中其他关键指标之间的关系。具体而言，在研究过程中需要明确以下几点：首先掌握"信息量"这一信息论中的基本概念；其次深入理解概率论中的期望值这一核心理论；最后建立不同概率分布之间的差异评估体系。这些要素共同构成了对KL散度这一指标的整体认识框架。

在深度学习模型中的应用

交叉熵用于衡量两个不同的概率分布之间的差异程度，在机器学习领域通常表示为真实概率分布与预测概率分布之间的差异情况。当交叉熵的数值越小时，则表明模型的预测效果更为优异。

在分类问题中，交叉熵常与softmax配作常用损失函数。为了使各类预测结果能够合理分配概率资源，softmax会对输出结果进行归一化处理。经过此处理后使得各类预测值总和归一化为1，在此基础上再通过交叉熵损失函数计算出模型的损失值。

softmaxloss的理解

softmaxloss是交叉熵的一种特殊情况。

softmax

对全连接的输入归一化。

以下文献对softmax有很好的解释：

《tensorflow实战Google深度学习框架》4.2节

后记

概念的学习是一个逐步深化的过程，在运用5why法时需分层深入才能全面 grasp 该知识点的核心内涵。例如，在深入理解交叉熵的过程中（如KL散度），必须先掌握散度的概念（如KL散度），进而需要理解信息熵的计算方法（如条件概率）。为了全面 grasp 信息论的核心概念（如互信息），还需深入学习信息量与期望的关系（如条件概率）。

借助举例的方式可以直观地理解公式的含义；实际上,任何数学公式本质上都是基于这些实例的总结.

全部评论 (0)

还没有任何评论哟~

一文读懂卷积神经网络中softmax，softmaxloss, 交叉熵的理解

softmaxloss,交叉熵损失函数的理解信息量意义公式信息熵意义相对熵（KL散度）交叉熵公式在深度学习模型中的应用 softmaxloss的理解 softmax 后记信息量意...

一文读懂卷积神经网络中的1x1卷积核

前言在介绍卷积神经网络中的1x1卷积之前，首先回顾卷积网络的基本概念[1]。 1.卷积核（convolutionalkernel）：可以看作对某个局部的加权求和；它是对应局部感知，它的原理是在观察某...

卷积神经网络文本分析,一文读懂卷积神经网络

卷积神经网络文本分类时，预训练word2vec的词向量。 1.PA=1/4,PBA=1/3,PAB=1/2,可得PAB=1/12,PB=1/6PX=0,Y=0=PA非B非=1PA+B=1[PA+PB...

卷积层的主要作用_对卷积神经网络CNN的理解，一文读懂卷积神经网络。

什么是神经网络？神经网络ANN全称为（artificialneutralnetwork），也就是人工神经网络，是一种仿人类神经网络原理构造的一种计算机模型。主要由：输入，权重，激活函数来构成一个简...

一文读懂卷积神经网络（CNN）

卷积神经网络—起源 1981年，Hubel和Wiesel对猫的视觉皮层细胞研究表明：哺乳动物对外界的视觉感知信息采用了局部感知策略，为此Hubel和Wiesel获得了诺贝尔生物理和医学奖。视觉的全局...

神经网络卷积神经网络,一文看懂卷积神经网络

cnn全称是什么？ CNN的全称是ConvolutionalNeuralNetwork，是一种前馈神经网络。由一个或多个卷积层、池化层以及顶部的全连接层组成，在图像处理领域表现出色。本文主要讲解CN...

神经网络 -- Softmax以及Cross entropy（交叉熵）

softmax和crossentropy都是神经网络中重要的函数。而且都有着广泛的应用。 softmax之所以称为“soft”是由于它不像onehot中的值，只有0或者1。 softmax会将输入的值...

Softmax与交叉熵：理解神经网络中的重要组成部分

在深度学习中，神经网络是一种广泛应用的模型，用于解决许多复杂的问题，如图像分类、语音识别和自然语言处理等。Softmax函数和交叉熵损失函数是神经网络中的重要组成部分，本文将重点介绍和解释Softma...

神经网络中的交叉熵

[参考《TensorFlow实战Google深度学习框架第2版》] 作为分类问题中的损失函数在神经网络的多分类问题中，常常使用onehot的方法设置n类输出，比如在手写体识别问题中，如果是数字1，神...

卷积神经网络中全连接层、softmax与softmax loss理解

一般一个CNN网络主要包含卷积层，池化层，全连接层，损失层等。卷积层与池化层在本篇中不做多理解，之后有时间再记录一下，本篇着重讲一下全连接层与损失层。 ———————————————————————...

是否确定退出登录?

一文读懂卷积神经网络中softmax，softmaxloss, 交叉熵的理解

softmaxloss, 交叉熵损失函数的理解

信息量

意义

公式

信息熵

意义

相对熵（KL散度）

交叉熵

公式

在深度学习模型中的应用

softmaxloss的理解

softmax

后记

全部评论 (0)

相关文章推荐

一文读懂卷积神经网络中softmax，softmaxloss, 交叉熵的理解

一文读懂卷积神经网络中的1x1卷积核

卷积神经网络文本分析,一文读懂卷积神经网络

卷积层的主要作用_对卷积神经网络CNN的理解，一文读懂卷积神经网络。

一文读懂卷积神经网络（CNN）

神经网络 卷积神经网络,一文看懂卷积神经网络

神经网络 -- Softmax以及Cross entropy（交叉熵）

Softmax与交叉熵：理解神经网络中的重要组成部分

神经网络中的交叉熵

卷积神经网络中全连接层、softmax与softmax loss理解

神经网络卷积神经网络,一文看懂卷积神经网络