Advertisement

【论文阅读笔记】Pelee: A Real-Time Object Detection System on Mobile Devices

阅读量:

Pelee: A Real-Time Object Detection System on Mobile Devices

  • (一)论文地址:
  • (二)核心思想:
  • (三)双向密集层:
  • (四)基线模块:
  • (五)瓶颈层通道数的动态调整:
  • (六)无需压缩的过渡层:
  • (七)复合函数:
  • (八)特征图选择:
  • (九)残差预测模块:
  • (十)小尺寸卷积核用于预测:
  • (十一)PeeleNet网络架构:
  • (十二)实验结果:

(这篇论文的作者的思路是真滴很清晰)

(一)论文地址:

https://arxiv.org/abs/1804.06882

(二)核心思想:

在2016年,作者成功开发了轻量级图像识别网络PeeLeNet,该网络以基于DenseNet的架构著称,相较于MobileNet在保持轻量特性的同时显著提升了识别精度。在此基础之上,作者构建了PeeLeNet作为目标检测任务的Backbone模块,以解决传统方法中过多依赖深度wise卷积所带来的未能充分提取特征信息的问题。

(三)Two-Way Dense Layer:

在这里插入图片描述

该方法基于 GoogleNet 网络的结构,在原有 dense layer 结构上增加了额外的通道。

其中,第二层通道采用了2层3×3卷积。这使得该网络相较于原来的结构具有更大的感受野,从而能够更有效地检测到较大的目标。

(四)Stem Block:

在这里插入图片描述

基于 InceptionV4 和 DSOD 网络结构的设计理念,作者在引入第一个 Dense Layer 之前,首先开发了一个高效的主要网络架构。在保持网络计算复杂度显著不变的情况下,显著提升了网络的特征表征能力。

(五)Dynamic number of channels in bottleneck layer:

在这里插入图片描述

值得注意的是,瓶颈层的通道数量会根据输入维度的变化进行调整,以确保输出通道的数量不会超过预期。

相较于原始的DenseNet架构,该方法在降低计算资源消耗的同时,对分类精度的影响较小;

(六)Transition Layer without Compression:

作者在试验中观察到,DenseNet方法通过减少Transition Layer中的通道数量来压缩特征表达能力,因此主张在Transition Layer中,输出通道数量应与输入层保持一致。

(七)Composite Function:

为了优化系统的运行效率,作者采用了以下复合函数作为预激活层:

Convolution - Batch Normalization - Relu

在DenseNet的后置激活过程中,所有Batch Normalization在推理阶段(中间层)与卷积层集成,显著提升了运行速度。

为了解决该问题,作者采用了单层的宽的网络结构,并在每个Dense Block之后增加一个1×1的卷积层,从而提升了特征表达能力。

(八)Feature Map Selection:

与 SSD 不同的是,作者采用了 19×19、10×10、5×5、3×3 和 1×1 大小的五个特征层,而非采用 38×38 大小的特征层,从而有效降低计算负担。

(九)Residual Prediction Block:

在这里插入图片描述

作者在每个特征层用于检测前,增加了一个 ResBlock 模块;

(十)Small Convolutional Kernel for Prediction:

与现有网络相比,本方法采用了 3×3 卷积结构。与现有网络相比,本方法改用 1×1 卷积结构,在准确率几乎持平的前提下,计算开销减少了 21.5%。

(十一)PeleeNet 的网络结构:

在这里插入图片描述

(十二)实验结果:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~