论文解读：Self-Distillation from the Last Mini-Batch for Consistency Regularization

阅读量：

1. 论文基本信息

该论文提出了一种基于最后一批次数据的自监督学习方法，并以一致性正则化为目标。该研究通过从训练过程中提取关键特征并进行重新利用，在提升模型泛化能力的同时实现了更好的分类性能表现。此外，在GitHub平台上提供了对应的开源代码仓库（https://github.com/Meta-knowledge-Lab/DLB），供研究人员参考和使用。该研究成果在第二十四届计算机视觉与模式识别大会（CVPR）上获得了认可。

2. 背景与摘要

已有大量研究关注知识蒸馏方法。从本质上看,知识蒸馏本质上是一种正则化手段,在图像分类任务中,加入后经实验验证,训练准确率通常会有所降低,而评估准确率通常会有所提升.

采用教师模型开展知识蒸馏任务时，通常需要较高的计算能力，并且整个过程相对复杂。传统的自蒸馏策略往往需要调整模型架构如引入注意力机制模块或采用随机丢弃层等技术手段以实现目标。本研究针对该种自蒸馏策略进行了优化创新，在考察相同批次数据上的预测结果一致性基础上设计了新的蒸馏方法——DLB（Dynamic Loss Balancing）方法，并成功实现了当前领域内的最优性能水平SOTA。

3. DLB方法流程图

基于DLB的方法流程图如下，在每次迭代过程中，每个批次的数据包括当前批次 $b_t$ 及其上一轮迭代生成的 $b_{t-1}$ 数据。其中 $dataloader$ 输出的当前批次数据为 $b_t$ ，而上一轮迭代生成的 $b_{t-1}$ 数据则用于辅助训练。在此基础上，我们不仅计算了与真实标签（ground truth）之间的交叉熵损失（CE loss），还记录了当前批次数据 $b_t$ 预测得到的软标签（softlabel）。并在此基础上计算其与下一批次预测输出之间的蒸馏损失（Distillation loss）。这种设计使得算法能够动态地调整模型参数以适应变化的数据分布趋势。这等同于一种动态的标签平滑机制（Label smoothing mechanism）的应用。

DLB算法的伪代码如下所示，在整个流程设计上相对较为简单，在实际实现过程中无需对dataloader和model进行任何修改；相较于其他自蒸馏策略而言，在代码实现上的改动幅度较小。

在此处作者对与当前流行的基于标签平滑的正则化方法进行了对比分析。相比于这些方法，在DLB中数据加载器和模型架构的设计更为简洁。在计算过程中采用了更具灵活性的label smooth策略。从而实现了更为有效的正则化效果。

4. 实验结果

在训练过程中，在每一个迭代周期中都会同时计算 $b_t$ 与 $b_{t-1}$ 的全局交叉熵损失值。这样就使得每一批数据经历两次网络处理的过程。因此，在进行实验研究时为了确保公平对比作者将DLB的迭代次数设定为其正常训练周期的一半这样能够保证用于反向传播的数据量维持一致水平

3个数据集的结果如下所示，不同数据集、不同模型，基本都有更优的效果。

5. 关于DLB，自己的一些看法

模型训练涉及多个关键要素包括数据集的选择与处理、网络架构的设计与优化、训练策略的选择以及损失函数的设计等方面。在完全依赖于人工干预的情况下（即无外部输入），采用自蒸馏的方法对模型结构进行优化较为常见。然而DLB（Data-Level Boosting）方法则针对相同数据集的一致性问题进行了深入研究，并在此基础上提出了独特的改进方案。
- 研究工作基于三个规模适中的数据集展开，并通过实验验证了所提出方法的有效性。该研究展现出更强的正则化能力，并显著提升了模型的鲁棒性能。值得注意的是该研究结果值得进一步验证在ImageNet 1000上的表现。

全部评论 (0)

还没有任何评论哟~

论文解读：Self-Distillation from the Last Mini-Batch for Consistency Regularization

1\.论文基本信息论文：SelfDistillationfromtheLastMiniBatchforConsistencyRegularization 地址：https://arxiv.org/p...

【KD】2022 CVPR Self-Distillation from the Last Mini-Batch for Consistency Regularization

目录简介 DLB自蒸馏框架 1\.本文的任务 2\.本文创新与贡献 DLB自蒸馏框架训练机制实验设置结语简介 OPPO研究院联合上海交通大学提出的新的自蒸馏框架DLB，无需额外的网络架构修改，...

【论文阅读】Consistency Policy：Accelerated Visuomotor Policies via Consistency Distillation

关键点提炼：通过在预训练的扩散策略学习到的轨迹上强制实现自一致性，从而从预训练的扩散策略中提炼出来保持了具有竞争力的成功率扩散模型的一个关键缺点是生成动作所需的推理时间阿迪蒂亚・普拉萨德（Aad...

论文解读（IGSD）《Iterative Graph Self-Distillation》

🚀优质资源分享🚀 学习路线指引（点击解锁）知识定位人群定位 🧡Python实战微信订餐小程序🧡进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全...

【论文笔记】On the Principles of Parismony and Self-Consistency for the Emergence of Intelligence

Motivation 智能体为在复杂环境中生存和工作，不得不高效和有效地（efficientlyandeffectively）学习反映历史经验和当前所感知的环境模型；模型是收集信息、做出决策和采取行动...

【论文阅读】Importance of Self-Consistency in Active Learning for Semantic Segmentation

GolestanehSA,KitaniKM.ImportanceofSelfConsistencyinActiveLearningforSemanticSegmentation[J].arXivpre...

Self Pseudo Entropy Knowledge Distillation for Semi-supervised Semantic Segmentation 论文阅读

paper:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10464380 code:https://github.com/xiao...

Unbiased Pairwise Consistency Regularization for SemiSu

作者：禅与计算机程序设计艺术 1.简介 SemisupervisedlearningSSL方法已经在图像、文本、语音、视频等多种领域中得到了广泛应用。然而，尽管目前已有很多研究成果表明SSL的效果非常...

CONSISTENCY REGULARIZATION FOR GENERATIVE ADVERSARIAL NETWORKS

CONSISTENCYREGULARIZATIONFORGENERATIVEADVERSARIALNETWORKS 众所周知，生成对抗网络gan很难训练，尽管有相当多的研究努力。已经提出了几种用于稳定...

论文解读 | Unsupervised Data Augmentation for Consistency Training

单位：燕山大学作者：王琴摘要深度学习尽管取得了很大的成功，但通常在带有小标签的训练集上不能很好地发挥作用。在这种情况下，数据增强在减少对标记数据的需求方面显示出了更大的优势，但是到目前为止，它主...

是否确定退出登录?

论文解读：Self-Distillation from the Last Mini-Batch for Consistency Regularization

1. 论文基本信息

2. 背景与摘要

3. DLB方法流程图

4. 实验结果

5. 关于DLB，自己的一些看法

全部评论 (0)

相关文章推荐

论文解读：Self-Distillation from the Last Mini-Batch for Consistency Regularization

【KD】2022 CVPR Self-Distillation from the Last Mini-Batch for Consistency Regularization

【论文阅读】Consistency Policy：Accelerated Visuomotor Policies via Consistency Distillation

论文解读（IGSD）《Iterative Graph Self-Distillation》

【论文笔记】On the Principles of Parismony and Self-Consistency for the Emergence of Intelligence

【论文阅读】Importance of Self-Consistency in Active Learning for Semantic Segmentation

Self Pseudo Entropy Knowledge Distillation for Semi-supervised Semantic Segmentation 论文阅读

Unbiased Pairwise Consistency Regularization for SemiSu

CONSISTENCY REGULARIZATION FOR GENERATIVE ADVERSARIAL NETWORKS

论文解读 | Unsupervised Data Augmentation for Consistency Training