tensorflow交叉熵损失函数

阅读量：

简介

tensorflow 图像分类问题中，常用的交叉熵损失计算有三个函数：

tf.nn.softmax_cross_entropy_with_logits: 该功能模块用于计算交叉熵损失。
tf.nn.softmax_cross_entropy_with_logits_v2: 此功能模块执行交叉熵损失计算，并支持版本号为2的功能增强。
tf.nn.sparse_softmax_cross_entropy_with_logits: 该组件专门用于处理稀疏标签的交叉熵损失计算。

简单记录一下这三个函数的用法，免得自己后面再忘记了。

1. `softmax_cross_entropy_with_logits`

该函数的声明如下：

复制代码

    def softmax_cross_entropy_with_logits(
    _sentinel=None,  # pylint: disable=invalid-name
    labels=None,
    logits=None,
    dim=-1,
    name=None):

需要注意的几点：

该函数已不再适用，请使用tf.nn.sparse_softmax_cross_entropy_with_logits_v2版本（V2）。其改进之处在于，在反向传播过程中不仅更新logits相关的参数，同时也更新labels相关的参数（V2版本会在计算过程中同步考虑这两者）。这一设计源于labels往往来源于机器学习模型的预测结果而非人工标注（尤其是在数据量巨大的情况下），因此手动标注会耗费大量的人力资源。
_sentinel的存在主要目的是确保在调用此函数时明确区分并指明哪些是labels参数、哪些是logits参数（例如调用方式应为：tf.nn.softmax_cross_entropy_with_logits(labels=..., logits=...))
logits参数代表的是网络输出前未经Softmax处理的结果（因为此函数内部会自动执行一次Softmax操作）。
labels与"logits"两个张量必须具有相同的形状，在一般情况下均为 [batchsize, numberClass]
labels张量中的每一行都需要满足概率分布的要求（即各行元素之和等于1），而"logits"则无需满足此条件。
dim参数主要应用于高维场景下指定哪一维代表分类结果维度（通常情况下，“labels”与"logits"张量的维度均为 [batchsize, numberClass], 因此该参数一般无需特别关注

2. `softmax_cross_entropy_with_logits_v2`

显然，这个函数时上个函数的改进版，其函数声明如下：

复制代码

    def softmax_cross_entropy_with_logits_v2(labels, logits, axis=-1, name=None):

注意的几点：

参数列表中采用了 axis 而非 dim。
省略了 _sentinel ，因此无需明确指出哪一个是 labels ，哪一个是 logits。
其余的基本配置与 softmax_cross_entropy_with_logits 相同。

3. `sparse_softmax_cross_entropy_with_logits`

在这个函数中, sparse 代表稀疏属性. 这个函数特别适用于处理仅包含一个类别标签的图片, 即 labels 的向量中通常仅有一个元素为1而其余元素均为0. 在MNIST、CIFAR-10等常见的图像分类任务中通常采用了此方法.

复制代码

    def sparse_softmax_cross_entropy_with_logits(
    _sentinel=None,  # pylint: disable=invalid-name
    labels=None,
    logits=None,
    name=None):

需要注意的一点：

这个函数的 labels 与其前两个函数存在显著差异。其 labels 值为索引型数据，具体指示图片所属类别而不提供分类概率。

The labels vector must require a unique identifier for the target class in each row of the logits tensor.

通常为 [batchsize] 维度。而 logits 类似地具有 [batchsize, numberClass] 维度。

举个例子说明一下：

复制代码

    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
        labels=tf.math.argmax(y_, 1),
        logits=y
    )
    
    # y_ 是 one_hot 形式的标签
    # y  是网络预测结果(不经过 softmax 处理)

小结

当 label 数据稀疏时采用 tf.nn.sparse_softmax_cross_entropy_with_logits 并特别提醒：在使用该函数时，请注意 labels 参数的维度设置。对于其他较为复杂的场景，则建议采用 tf.nn.softmax_cross_entropy_with_logits_v2 进行计算

全部评论 (0)

还没有任何评论哟~

tensorflow交叉熵损失函数

简介 tensorflow图像分类问题中，常用的交叉熵损失计算有三个函数： 1.tf.nn.softmaxcrossentropywithlogits 2.tf.nn.softmaxcrossentr...

交叉熵损失函数python_交叉熵损失函数nn.CrossEntropyLoss()

nn.CrossEntropyLoss 1.引言在使用pytorch深度学习框架做多分类时，计算损失函数通常会使用交叉熵损失函数nn.CrossEntropyLoss 2\.信息量和熵信息量：它是...

交叉熵损失函数优缺点_交叉熵损失函数

交叉熵代价函数Crossentropycostfunction是用来衡量人工神经网络ANN的预测值与实际值的一种方式。与二次代价函数相比，它能更有效地促进ANN的训练。在介绍交叉熵代价函数之前，本文先...

交叉熵损失函数及Tensorflow实现

一、交叉熵损失原理一般情况下，在分类任务中，神经网络最后一个输出层的节点个数与分类任务的标签数相等。假设最后的节点数为N，那么对于每一个样例，神经网络可以得到一个N维的数组作为输出结果，数组中每一...

交叉熵损失函数优缺点_交叉熵损失函数nn.CrossEntropyLoss()

nn.CrossEntropyLoss 1.引言在使用pytorch深度学习框架做多分类时，计算损失函数通常会使用交叉熵损失函数nn.CrossEntropyLoss 2\.信息量和熵信息量：它是...

交叉熵损失函数

在理解交叉熵损失函数之前，有必要先来说一下信息熵这个概念信息熵信息熵可以理解为信息杂乱程度的量化描述：信息越多，概率越均等则信息熵就越大；反之，信息越单一，概率越偏向其中某一个信息，那么熵值就越小...

交叉熵损失函数

交叉熵CrossEntropy是与均值误差MSE一样常用的损失函数，用在分类中。一、分类的损失函数为什么我们选择交叉熵作为损失函数呢？它与其他的损失函数相比有什么好处呢？我们用下面的例子来说明： ...

python交叉熵损失函数实现_大话交叉熵损失函数

使用keras进行二分类时，常使用binarycrossentropy作为损失函数。那么它的原理是什么，跟categoricalcrossentropy、sparsecategoricalcrosse...

交叉熵损失函数计算过程(tensorflow)

交叉熵损失函数通常用于多类分类损失函数计算。计算公式如下： P为真实值，Q为预测值。使用tensorflow计算 importtensorflowastf importkeras 创建一个示例数据集...

交叉熵：计算交叉熵损失函数nn.CrossEntropyLoss()

首先要提出的问题是。。。什么是损失函数？干什么的（功能）？类型有哪些？ 1.什么是损失函数？损失函数（lossfunction）或代价函数（costfunction）是将随机事件或其有关随机变量的取...

是否确定退出登录?

tensorflow交叉熵损失函数

简介

1. softmax_cross_entropy_with_logits

2. softmax_cross_entropy_with_logits_v2

3. sparse_softmax_cross_entropy_with_logits

小结

全部评论 (0)

相关文章推荐

tensorflow交叉熵损失函数

交叉熵损失函数python_交叉熵损失函数nn.CrossEntropyLoss()

交叉熵损失函数优缺点_交叉熵损失函数

交叉熵损失函数及Tensorflow实现

交叉熵损失函数优缺点_交叉熵损失函数nn.CrossEntropyLoss()

交叉熵损失函数

交叉熵损失函数

python交叉熵损失函数实现_大话交叉熵损失函数

交叉熵损失函数计算过程(tensorflow)

交叉熵：计算交叉熵损失函数nn.CrossEntropyLoss()

1. `softmax_cross_entropy_with_logits`

2. `softmax_cross_entropy_with_logits_v2`

3. `sparse_softmax_cross_entropy_with_logits`