Advertisement

【论文阅读笔记】ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

阅读量:

ShuffleNet: A highly efficient Convolutional Neural Network specifically designed for mobile devices.

  • (一) 论文链接:
  • (二)研究内容:
  • (三)该方法基于分组卷积机制,通过逐点卷积实现特征的局部表达。
  • (四)通道重组机制通过重新排列通道中的特征图,增强了特征的表达能力。
  • (五)网络架构基于深度可分离卷积模块,通过交错应用分组卷积和通道重组机制,实现了高效的特征提取。
  • (六)实验验证结果表明,该网络在保持较高精度的同时,显著降低了计算复杂度。

(一) 论文地址:

该研究提出了一种在移动设备上高度高效的卷积神经网络架构,特别适用于轻量化任务。该论文通过创新的通道排列设计实现了网络参数的大幅压缩,同时保持了与现有模型相当的性能水平。研究结果表明,该方法在移动设备上的推理速度和资源占用均显著优于传统卷积神经网络。该工作为开发高效移动应用提供了新的技术参考。

(二)核心思想:

在研究过程中,作者发现包括Xception和ResNeXt等采用group convolution的网络在结构缩减时表现出明显的低效性,这一现象主要源于密集的1×1卷积操作所带来的计算负担。

通过提高计算效率,作者开发出了一个高效的ShuffleNet网络架构,以解决1×1group卷积带来的边缘效应问题。该网络的核心架构包含两个关键模块。

一个新的卷积操作:基于分组的点态卷积
一个新的创新操作:基于通道交错的创新重组机制

(三)Pointwise Group Convolutions:

在小型网络中,逐点卷积计算的开销较大。为缓解这一问题,一种有效的缓解方法是采用通道稀疏连接策略,其中,一种具体实现方式是在1×1卷积层中引入组卷积操作。

在这里插入图片描述

值得注意的是,当多个1×1卷积层进行叠加时,会导致某通道的输出仅受限于一小部分输入通道,从而限制了各组特征之间的信息交流;

为了解决这个问题,作者又提出了Channel Shuffle;

(四)Channel Shuffle:

在这里插入图片描述

具体而言,针对从前一组图层生成的特征图,我们可以将每个组的通道细致地分割为多个子组,并在后续一层中为每个组分配独特的子组,从而促进各组数据间的相互流动。

该作者基于channel shuffle操作设计了一种专为小型网络优化的新型ShuffleNet单元。

在这里插入图片描述

作者基于图(a)所示的残差结构,分别提出了stride=1,2的两种单元;

(五)ShuffleNet的网络结构:

在这里插入图片描述

其中g是Group Convolution的卷积组的数目;

(六)实验结果:

在这里插入图片描述
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~