【论文阅读笔记】Pelee: A Real-Time Object Detection System on Mobile Devices
Pelee: A Real-Time Object Detection System on Mobile Devices
- (一)论文地址:
- (二)核心思想:
- (三)双向密集层:
- (四)基线模块:
- (五)瓶颈层通道数的动态调整:
- (六)无需压缩的过渡层:
- (七)复合函数:
- (八)特征图选择:
- (九)残差预测模块:
- (十)小尺寸卷积核用于预测:
- (十一)PeeleNet网络架构:
- (十二)实验结果:
(这篇论文的作者的思路是真滴很清晰)
(一)论文地址:
https://arxiv.org/abs/1804.06882
(二)核心思想:
在2016年,作者成功开发了轻量级图像识别网络PeeLeNet,该网络以基于DenseNet的架构著称,相较于MobileNet在保持轻量特性的同时显著提升了识别精度。在此基础之上,作者构建了PeeLeNet作为目标检测任务的Backbone模块,以解决传统方法中过多依赖深度wise卷积所带来的未能充分提取特征信息的问题。
(三)Two-Way Dense Layer:

该方法基于 GoogleNet 网络的结构,在原有 dense layer 结构上增加了额外的通道。
其中,第二层通道采用了2层3×3卷积。这使得该网络相较于原来的结构具有更大的感受野,从而能够更有效地检测到较大的目标。
(四)Stem Block:

基于 InceptionV4 和 DSOD 网络结构的设计理念,作者在引入第一个 Dense Layer 之前,首先开发了一个高效的主要网络架构。在保持网络计算复杂度显著不变的情况下,显著提升了网络的特征表征能力。
(五)Dynamic number of channels in bottleneck layer:

值得注意的是,瓶颈层的通道数量会根据输入维度的变化进行调整,以确保输出通道的数量不会超过预期。
相较于原始的DenseNet架构,该方法在降低计算资源消耗的同时,对分类精度的影响较小;
(六)Transition Layer without Compression:
作者在试验中观察到,DenseNet方法通过减少Transition Layer中的通道数量来压缩特征表达能力,因此主张在Transition Layer中,输出通道数量应与输入层保持一致。
(七)Composite Function:
为了优化系统的运行效率,作者采用了以下复合函数作为预激活层:
Convolution - Batch Normalization - Relu
在DenseNet的后置激活过程中,所有Batch Normalization在推理阶段(中间层)与卷积层集成,显著提升了运行速度。
为了解决该问题,作者采用了单层的宽的网络结构,并在每个Dense Block之后增加一个1×1的卷积层,从而提升了特征表达能力。
(八)Feature Map Selection:
与 SSD 不同的是,作者采用了 19×19、10×10、5×5、3×3 和 1×1 大小的五个特征层,而非采用 38×38 大小的特征层,从而有效降低计算负担。
(九)Residual Prediction Block:

作者在每个特征层用于检测前,增加了一个 ResBlock 模块;
(十)Small Convolutional Kernel for Prediction:
与现有网络相比,本方法采用了 3×3 卷积结构。与现有网络相比,本方法改用 1×1 卷积结构,在准确率几乎持平的前提下,计算开销减少了 21.5%。
(十一)PeleeNet 的网络结构:

(十二)实验结果:




