Advertisement

《AutoAugment: Learning Augmentation Strategies from Data》笔记

阅读量:

Introduction

进行数据增强能够显著提升分类模型的准确性。
传统模型训练通常仅采用单一的数据增强手段,并未深入研究如何将多种数据增强技术进行优化组合。
受网络架构搜索技术启发,
本研究旨在探索最佳的数据增强策略。
为此,
本研究构建了一个包含多种不同的数据预处理手段的空间,
其中包含多种不同的数据预处理手段,
并将其命名为子策略组。
随后通过强化学习算法在该空间中寻找到最佳的数据增广方案。
这种方法被称为AutoAugment系统。

该方法有两种优点:

  • 直接应用于 该任务时,在对某个特定的数据集进行分类模型训练的过程中,通过采用AutoAugment方法能够自动识别并应用最佳的数据增强策略,并显著提升该模型的分类准确率。
  • 将从一个领域或场景中获得的最佳数据增强方案迁移到其他相关场景中时,在另一类问题中同样能显著提升该模型的整体性能。

Method

该方法主要包含两个核心要素:一是对搜索机制的探索,二是对优化方案的设计。其中的搜索机制由一个基于循环神经网络的控制器模块负责。通过该机制对预定义的候选数据增强策略进行筛选与排序。其筛选出的理想增强方案被用来构建新的训练样本集。并将其在验证集上的准确率指标作为优化目标。最后通过这一指标值来更新控制模块的各项参数。

AutoAugment的训练流程如下

AutoAugment训练流程

主要关注AutoAugment的搜索空间设计。该方法通过定义一个包含多个候选操作符的空间来生成有效的数据增强策略组合。具体而言,在该框架下构建了一个由多个候选操作符构成的操作符集合,在该操作符集合中通过自适应机制动态地选择最合适的操作符组合来提升模型性能。每个候选操作符都对应于特定的数据预处理步骤,并且这些操作符之间相互独立且互不干扰地作用于输入样本上以实现更好的特征提取效果。在训练阶段,在每次提取的小批量数据中都会随机选择并应用其中一种增强技术

每个子策略都包含两个图像处理函数。每个图像处理函数包含三个属性:功能类型、应用概率和重要性。

论文中使用了16种图像处理函数类型:Shearing操作、平移操作、旋转处理、自动对比度增强、图像反色处理、直方图均衡化处理、太阳化效果增强、Posterize效果强化、对比度提升处理、色彩增强处理、亮度提升处理、锐度增强处理、裁剪效果强化以及样本配对技术。

在判断是否涉及对图片进行特定处理时,在判断阶段使用了概率作为指标。作者将这一过程细化为将概率值划分为连续的区间,并确定每个区间对应的具体数值范围。具体来说,在这一过程中将概率分成11个区间,并设定其数值范围为从0到1

重要性:该属性属于强化学习所需的关键属性。为了实现搜索空间的离散化,作者将其划分为1至10级。

该子策略在搜索空间中共包含(16×11×10)^2种可能性。由于自身映射函数是一个关键的影响因素,在此搜索空间中已经包含了这一函数(其概率值为零)。

该搜索算法基于 recurrent neural network (RNN) 架构,在具体实现中主要采用的是 LSTM 神经网络。其核心功能在于从整个搜索空间中动态选择和优化执行的具体策略。该 RNN 系统通常被称作 controller 或者行为决策器,其参数通过深度学习方法被有效优化获得。基于 Proximal Policy Optimization (PPO) 策略优化方法的学习算法,在每次迭代更新过程中需要对每个控制节点输出 30 组 softmax 预测值来指导后续的行为决策过程。这些预测值由 5 个子策略模块构成,每个子策略又包含两个操作维度:一个是操作类型的选择维度;另一个是操作重要性排序维度;同时还需要考虑各个操作的具体应用概率权重因素。

该控制器利用反馈信号进行训练操作。该反馈信号旨在优化子模型的泛化能力。其中,子模型即为分类器,在验证集上评估其分类准确性作为衡量标准。值得注意的是每个主策略包含五个不同的分支策略,在每一个小批量处理过程中会随机选取其中一个分支进行执行。

该控制器为单层 LSTM 网络架构,在每一层包含 100 个隐藏单元的基础上设计了一个分组进行的 softmax 预测系统(其中包含五个子策略,并且每个子策略涉及两个操作步骤)。经过分析发现该系统缺少了三种重要的属性信息,并且参数 B 决定了 RNN 输出的子策略数量(论文中 B=5)。

控制器RNN的训练采用当前流行的策略优化技术(Proximal Policy Optimization algorithm)。我对该方法的工作原理不熟悉,并不做深入探讨。

训练结束后,在训练周期结束时将最佳五个方案集成在一起,并最终采用其中一个优化方案作为最终结果。该方法基于AutoAugment框架,在每一个小批量样本中随机选取一个优化方案进行应用。

Experiment

该实验研究会在多样化的数据集上评估对比采用AutoAugment策略与未采用该策略的分类性能表现如何。

先比较最优结果和使用AutoAugment后的结果

分类结果

可以看出通过采用AutoAugment技术后模型的表现得到了明显提升需要注意的是在进行AutoAugment的训练过程中会有一定的成本投入请确保自身能够承担起相应的费用

接着看看和baseline比较的结果

分类结果

Baseline下的增强措施包括数据归一化处理和以50%的概率实施水平翻转操作。而AutoAugment则是通过在这些基础操作上叠加基于最优策略的优化增强手段实现整体效果提升。

对于这个问题存在疑问,在分析过程中发现模型效果提升的原因并非源于所采用的数据增强措施。

最后进一步探究AutoAugment的适用性。基于ImageNet的最佳策略被成功推广至其他数据集。

AutoAugment可迁移性探究

我对这一问题感到困惑,并非第一次遇到。模型性能提升的原因并非单纯由于添加更多数据增强方法吗?在探讨AutoAugment的可迁移性时,请问其可迁移性是否能归因于策略中所采用的数据增强方法的通用性?换言之,在当前研究背景下,这种通用性的存在是否有助于解释AutoAugment现象?值得注意的是,在上述研究中所采用的数据增强策略能够在不同数据集上保持适用性。

个人认为该论文的主要贡献在于为我们在选择数据增强方法时呈现了更为优化的选择方案。

全部评论 (0)

还没有任何评论哟~