信息熵，交叉熵，KL散度（机器学习笔记）

阅读量：

0 引入

读论文的时候遇到了如下损失函数：

(2)式第一部分为二元交叉熵，第二部分为“类KL散度”（其中λ是人为设置的参数），(3)式为(2)式第二部分具体表达式。

我不是很了解交叉熵的概念，因此我查阅了一些资料，顺便记载下来。

1 信息熵，交叉熵，KL散度

记号	表达式	意义
信息熵	H(p)		信息量的期望值
交叉熵	H(p,q)		用错误(预测)分布q来表示来自真实分布p的平均编码长度
KL散度	D(p	q)		KL散度=交叉熵-信息熵，衡量分布p相比分布q的差异

2 均方误差、交叉熵、KL散度与机器学习

1、交叉熵代价函数与均方误差代价函数

我们希望在训练神经网络时，预测值与实际值的误差越大，在反向传播训练的过程中，各种参数调整的幅度就应该越大，从而使训练更快收敛。

当我们使用“类sigmoid函数”作为激励函数时，如果使用均方误差作为代价函数的话，代价函数的导函数会含有σ′(z)(sigmoid函数的导数)因子，由于sigmoid函数的性质，会导致反向传播训练步伐很小，造成更新很慢。

而交叉熵代价函数求导之后σ′(z)会被消掉，保证了“当误差大的时候，权重更新就快，当误差小的时候，权重的更新就慢”这个很好的性质。

全部评论 (0)

还没有任何评论哟~

信息熵，交叉熵，KL散度（机器学习笔记）

0引入读论文的时候遇到了如下损失函数： 2式第一部分为二元交叉熵，第二部分为“类KL散度”（其中λ是人为设置的参数），3式为2式第二部分具体表达式。我不是很了解交叉熵的概念，因此我查阅了一些资料，...

信息熵、交叉熵与KL散度

信息量在信息论与编码中，信息量，也叫自信息（selfinformation），是指一个事件所能够带来信息的多少。一般地，这个事件发生的概率越小，其带来的信息量越大。从编码的角度来看，这个事件发生的概...

machine learning学习笔记（一）：信息熵，条件熵，交叉熵，KL散度，互信息

一、琴生不等式Jensen 由数学归纳法证明二、对损失函数Logarithmicfunction 三、entropy信息熵信息熵代表x的不确定程度/混乱程度 log底数一般为2.信息熵代表着X不确...

信息熵，交叉熵，相对熵，KL散度

熵，信息熵在机器学习和深度学习中是十分重要的。那么，信息熵到底是什么呢？首先，信息熵是描述的一个事情的不确定性。比如：我说，太阳从东方升起。那么这个事件发生的概率几乎为1，那么这个事情的反应的信息量...

详解熵，交叉熵，KL散度，互信息

首先介绍几个信息论中的概念。熵，表示某个概率分布的不确定度： Hx=\sumpxlogpx 联合熵，两个变量联合分布的不确定度： Hx,y=\sum\sumpx,ylogpx,y 条件熵，在X确定后...

《机器学习-小知识点》2：熵，信息量，交叉熵，KL散度

主要参考资料：https://www.bilibili.com/video/BV15V411W7VB 09.21 这个视频非常棒，有时间可以看看 <iframesrc='https://player....

【机器学习】信息量，信息熵，交叉熵，KL散度和互信息（信息增益）

首先先强烈推荐一篇外文博客VisualInformationTheory这个博客的博主colah是个著名的计算机知识科普达人，之前非常著名的那篇LSTM讲解的文章也是他写的。这篇文章详细讲解了信息论中...

GAN学习笔记——KL散度、交叉熵、JS散度

首先，我们知道，熵是用来量化数据中含有的信息量的，其计算公式为： H=\sumi=1^Npxi\cdot\logpxi 1）KL散度（Kullback–Leiblerdivergence）又称KL距...

ML1 - 熵、信息、交叉熵、KL散度、log-likelihood、互信息

（截图来自英文维基）单一事件的熵：plogp 假设p=1/2，logp=log2；假设q=1/1024，logq=log1024；根据对数公式，有log1024/log2=10；这个运算可以理...

熵，交叉熵，相对熵（KL散度）

先插入一个链接可视化信息论，简单明了很容易看懂什么是信息熵信息熵是度量随机变量不确定度的指标，信息熵越大意味着随机变量不确定度越高，意味着系统的有序程度越低。

是否确定退出登录?

信息熵，交叉熵，KL散度（机器学习笔记）

0 引入

1 信息熵，交叉熵，KL散度

2 均方误差、交叉熵、KL散度与机器学习

全部评论 (0)

相关文章推荐

信息熵，交叉熵，KL散度（机器学习笔记）

信息熵、交叉熵与KL散度

machine learning学习笔记（一）：信息熵，条件熵，交叉熵，KL散度，互信息

信息熵，交叉熵，相对熵，KL散度

详解熵， 交叉熵，KL散度，互信息

《机器学习-小知识点》2： 熵，信息量，交叉熵，KL散度

【机器学习】信息量，信息熵，交叉熵，KL散度和互信息（信息增益）

GAN学习笔记——KL散度、交叉熵、JS散度

ML1 - 熵、信息、交叉熵、KL散度、log-likelihood、互信息

熵，交叉熵，相对熵（KL散度）

详解熵，交叉熵，KL散度，互信息

《机器学习-小知识点》2：熵，信息量，交叉熵，KL散度