CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

阅读量：

CurriculumNet: 采用弱监督学习策略以处理大型网络图像数据集，在ECCV会议中首次展示并获得2018年的最佳论文奖

要点

1、基于大规模弱监督网络图像的数据集进行深度神经网络的训练工作，在该数据集上实现了对关键词索引互联网图像的有效分类任务（注：注释已被删除）。通过引入课程学习策略来优化模型的学习过程，在处理大量噪声标签和数据不均衡问题方面取得了显著成效。
2、本文提出了一种新的学习课程设计方法：利用特征空间中的数据密度分布来量化数据复杂性特征，并采用无监督学习方法对复杂性进行排序，在这一框架下实现了对高噪声标签直接搜索能力的有效提升。
3、本研究的主要目标在于开发一套能够有效应对大规模噪声标签和数据不平衡问题的解决方案，在这一目标下提出了基于课程学习的简单高效训练策略，并通过引入高噪声标签实现了标准深度神经网络模型泛化能力与整体性能水平的显著提升。
4、本文所提出的无监督式课程设计方法采用了新颖的学习策略，在CNN模型的参数更新过程中不断优化各层节点之间的关系配置；研究发现随着噪声标签数量逐渐增加的过程中模型收敛速度得到了明显改善。
5、通过多阶段的学习机制优化过程，在不同阶段交替进行模型参数更新与优化工作；这种改进方法显著提升了标准神经网络模型在面对大量噪声标签时的整体性能表现。
6、该课程学习策略使得模型在初始阶段就能够更加高效地完成复杂样本的学习任务；同时通过动态调整模型的学习重点实现了全局性优化目标；最终达到了逐步增强模型泛化能力的目的。

图表

网络流程图

复制代码

    训练过程主要包括三个步骤：
    1、初始特征生成器
    （1）使用所有训练数据来训练一个初始模型
    （2）针对训练集，使用初始模型，生成每张图像的深度表示（比如全连接层特征）
    
    2、课程设计
    （1）初始模型将所有训练图像大致映射到一个特征空间
    （2）针对特征空间，可以发现每一类的底层结构和相关性
    （3）特征空间提供定义图像复杂性的有效方法
    （4）通过探索复杂性来设计学习课程，其中，每个类别的图像都被划分成按复杂性排序的多个子集
    
    3、课程学习
    （1）基于设计的课程，采用课程学习方法，从最简单的子集开始训练CNNs
    （2）最简单的子集包括了所有类别的最简单子集
    （3）最简单子集含有更多的带有正确标签的干净图像
    （4）在训练过程中逐渐加入越来越复杂的数据，逐步提高模型的能力

聚类

复制代码

    1、猫的三个子集
    2、课程学习过程
    （1）使用标准的Inception_v2，仅使用干净的数据Subset1训练
    	其中每张图像都具有接近的视觉外观，这使得模型能够从每个类别中学习基本但清晰的视觉信息，作为后续过程的基本特征
    （2）当第一阶段收敛时，添加Subset2继续学习
    	其中图像具有更显著的视觉多样性，使模型从更难的样本中学习到更有意义和辨别性的特征
    	尽管有噪声的数据可能包含不正确的标签，但它大致保留了数据的主要结构，从而提高了性能
    （3）添加Subset3
    	包含大量视觉上不相关且标签不正确的图像的高噪声数据
    
    通过前两阶段课程学习到的深层特征能够捕获数据的主要底层结构
    在最后一阶段添加的高噪声数据对学习的数据结构没有负面影响
    相比之下，通过提供一种正则化的方式，提高了模型的泛化能力，并允许模型避免在干净的数据上过度拟合
    当训练在最后阶段收敛时，得到最终模型，其中三个子集全部合并
    在第二阶段和第三阶段对不同子集的样本进行组合时，我们将不同子集的训练样本的损失权重分别设置为干净子集、噪声子集和高噪声子集分别为1、0.5和0.5

整体梳理：

实验细节

复制代码

    1、不均衡问题
    （1）子集级平衡：在每个min-batch中分别为阶段1-3选择(256,0,0)，(128,128,0)和(128,64,64)训练样本
    （2）类别级平衡：在每个min-batch中，首先从1000个类别中随机选择256个(阶段1)或128个(阶段2和3)类别，然后从每个选定的类别中随机选择一个样本
    	注意，类别级平衡只在干净的子集上实现。当我们把它应用到有噪声或高噪声的子集时，性能下降了
    	因为我们从类别级平衡的每个类别中随机收集单个样本，所以有可能从噪声或高噪声子集中获得单个但完全不相关的样本，这将对训练产生负面影响

代码

https://github.com/guoshengcv/CurriculumNet

全部评论 (0)

还没有任何评论哟~

CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

CurriculumNet:WeaklySupervisedLearningfromLargeScaleWebImages,ECCV,2018 要点 1、在大规模弱监督网络网络图像上训练深度神经网络，...

论文阅读学习 - CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

原文：论文阅读学习CurriculumNet:WeaklySupervisedLearningfromLargeScaleWebImagesAIUAI 论文：CurriculumNet:WeaklyS...

[WSIS] Weakly-supervised Instance Segmentation via Class-agnostic Learning with Salient Images

1\.Motivation 弱监督实例分割（WSIS） WeaklysupervisedinstancesegmentationWSISisimportantincomputervisionforat...

Automatic Weakly Supervised Object Detection From High Spatial Resolution Remote Sensing Images via

原论文：AutomaticWeaklySupervisedObjectDetectionFromHighSpatialResolutionRemoteSensingImagesviaDynamicCu...

Clinical grade computional pathology using weakly supervised deep learning on whole slide images

Abstract 需要大量手工标注数据集一直阻碍病理学方面的决策支持系统的发展以及在临床上部署。为了解决这一问题，本文提出了基于多实例学习的深度学习系统，其仅仅使用已报告的诊断作为训练的标签，得意边广...

17-WILDCAT-Weakly-Supervised-Learning-of-DeepConvNets

who对谁有效弱监督图像语义分割 where 只有图像级标签的数据 when CVPR2017 what（WILDCAT是什么）这篇论文提出了一个框架，可以使用弱监督的方法识别一个物体显著的局部...

Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning

摘要：现有的视觉表达学习任务中，深度神经网络通常由单个标签的图像训练而来，例如ImageNet。然而单个标签很难描述样本中所有的重要内容，有些有用的视觉信息在训练时可能会浪费掉了。本文中，我们期望利...

Learning Traffic as Images: A Deep Convolutional Neural Network for Large-Scale Transportation Netwo

author：XiaoleiMa1,ZhuangDai1,ZhengbingHe2,JihuiMa2,,YongWang3andYunpengWang time：2017 链接：<https://ww...

Large-scale Machine Learning

1\.LinearRegression（线性回归）适用场景：用于预测连续变量（如房价、销量），当特征与目标变量存在线性关系时。 ApplicationScenario:Usedforpredicti...

[AAAI2020] From Few to More: Large-scale Dynamic Multiagent Curriculum Learning 笔记

文章目录前言前言这篇文章介绍了三种迁移方法，来通过课程学习加速。然后提出了一个新的架构DyAN，使得模型与agent数目无关。...一个有效的解决large-scale多智能体学习问题的方法是...

CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

要点

相关工作

图像分类的噪声标注处理

课程设计

聚类算法

图表

实验细节

代码

全部评论 (0)

是否确定退出登录?

CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

要点

相关工作

图像分类的噪声标注处理

课程设计

聚类算法

图表

实验细节

代码

全部评论 (0)

相关文章推荐

CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

论文阅读学习 - CurriculumNet: Weakly Supervised Learning from Large-Scale Web Images

[WSIS] Weakly-supervised Instance Segmentation via Class-agnostic Learning with Salient Images

Automatic Weakly Supervised Object Detection From High Spatial Resolution Remote Sensing Images via

Clinical grade computional pathology using weakly supervised deep learning on whole slide images

17-WILDCAT-Weakly-Supervised-Learning-of-DeepConvNets

Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning

Learning Traffic as Images: A Deep Convolutional Neural Network for Large-Scale Transportation Netwo

Large-scale Machine Learning

[AAAI2020] From Few to More: Large-scale Dynamic Multiagent Curriculum Learning 笔记