pytorch：交叉熵（cross entropy）

阅读量：

1、entropy

也被认为是另一种形式，并且还可以称为不确定性；此外还可以称为惊喜度（measure of surprise）

如果p（x）采用0-1分部，那么entropy=1log1=0

而对于entropy越大，即熵越大，越不稳定，惊喜度越高

例

复制代码

 import torch

    
 a=torch.full([4],1/4.)
    
 a*torch.log2(a)
    
 # tensor([-0.5000, -0.5000, -0.5000, -0.5000])
    
 -(a*torch.log2(a)).sum()
    
 #输出  tensor(2.)

输出熵为2，不确定性较大惊喜度就比较高

复制代码

 import torch

    
 a=torch.tensor([0.001,0.001,0.001,0.999])
    
 -(a*torch.log2(a)).sum()
    
 # 输出tensor(0.0313)

此时，输出熵为0.0313，比较小，不确定性小，惊喜度很低。

2、cross entropy

cross entropy有两个分部，H（p，q）=

推导成

其中，在后文中涉及的KL散度（Kullback-Leibler divergence）实际上是衡量两个概率分布之间差异程度的真实指标。当所考察的概率分布p与q之间相似度较小时，则其散度值较大；而当p与q完全相同时，则其值趋近于0。

所以有结论，p=q时，H（p，q）=H（p）即cross entropy=entropy

当采用0-1分布时，H（p）=0，刚好优化

举例说明

而当我们得到的模型概率q（x）变化时，得到以下结果。

3、为什么不用MSE？

原因：（1）在采用Sigmoid配合MSE损失函数时，可能会导致Sigmoid单元发生梯度消失现象。

（2）梯度信息小，收敛慢

（3）但是偶尔cross entropy不行的时候，可以考虑MSE

4、总结

一个神经网络的流程

python中cross entropy（）=softmax（）+log+null_loss（）

代码过程

复制代码

 import torch

    
 import torch.nn.functional as F
    
 x=torch.randn(1,784)
    
 w=torch.randn(10,784)
    
 logits=x@w.t()  # x和w矩阵相乘加上b得到logits
    
 pred=F.softmax(logits,dim=1)  # 经过softmax得到一个pred
    
 pred_log=torch.log(pred)  # 进行log操作，得到log（pred）
    
 F.cross_entropy(logits,torch.tensor([3]))  # 使用cross entropy 第一项必须是logits，因为cross entropy内有softmax
    
 #  python中cross entropy（）=softmax（）+log+null_loss（）
    
 #输出tensor(2.9087)
    
 F.nll_loss(pred_log,torch.tensor([3]))
    
 #输出tensor(2.9087)

全部评论 (0)

还没有任何评论哟~

pytorch：交叉熵（cross entropy）

1、entropy entropy中文叫做熵，也叫不确定性，某种程度上也叫惊喜度（measureofsurprise） = 如果p（x）采用01分部，那么entropy=1log1=0 而对于entr...

交叉熵（Cross-Entropy）

交叉熵（CrossEntropy）交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量？假设值也非常的低。

交叉熵cross entropy

在统计学中,损失函数是一种衡量损失和错误程度的函数.建设某样本的实际输出为a,而预计的输出为y,则y和a之间可能会不一样,存在偏差,深度学习的目的就是通过不断地训练迭代,使得a越来越接近y,即,而训练...

交叉熵（Cross-Entropy）

交叉熵（CrossEntropy）交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量？假设X是一个离散型随机变量，其取值集合为\mathcalX，...

Tensorflow中的交叉熵（Cross Entropy）

Tensorflow中的交叉熵（CrossEntropy） 1CrossEntropySigmoid 适用于二分类，输入函数的logits和labels应当是一维的。如果输入OneHot过的logit...

一文懂交叉熵Cross-Entropy

本文翻译自<https://naokishibuya.medium.com/demystifyingcrossentropye80e3ad54a8 交叉熵由交叉（Cross）和熵（Entropy）两部...

交叉熵误差（cross entropy error)

熵真是一个神奇的东西，据说之所以把它命名为熵就是因为它难以理解但是它确实是一个很有用的西东，光机器学习里面，就经常见到它的身影，决策树要用到它，神经网络和logistic回归也用到了它。

Tensorflow 交叉熵（Cross Entropy）详解

TensorFlow针对分类问题，实现了四个交叉熵函数，分别是 tf.nn.sigmoidcrossentropywithlogits tf.nn.softmaxcrossentropywithlog...

交叉熵损失cross entropy loss

我们一般在回归问题中，损失函数经常会用到MSE（meansquarederror），而在分类问题中，我们经常会用到CrossEntropy。我们经常把它与softmax一起用，因为我们用交叉熵计算出来...

交叉熵代价函数（cross-entropy)

目的：让神经网络学习更快假设简单模型:只有一个输入,一个神经元,一个输出简单模型:输入为1时,输出为0 初始w=0.6,b=0.9初始预测的输出a=0.82,需要学习学习率:0.15 演示：初...

是否确定退出登录?

pytorch：交叉熵（cross entropy）

全部评论 (0)

相关文章推荐

pytorch：交叉熵（cross entropy）

交叉熵（Cross-Entropy）

交叉熵cross entropy

交叉熵（Cross-Entropy）

Tensorflow中的交叉熵（Cross Entropy）

一文懂交叉熵Cross-Entropy

交叉熵误差（cross entropy error)

Tensorflow 交叉熵（Cross Entropy）详解

交叉熵损失cross entropy loss

交叉熵代价函数（cross-entropy)