[论文解读]ICCV 2019|LRF:Learning Rich Features at High-Speed for Single-Shot Object Detection
题目 :Learning Rich Features at High-Speed for Single-Shot Object Detection
作者 :Tiancai Wang, Rao Muhammad Anwer , Hisham Cholakkal , Fahad Shahbaz Khan Yanwei Pang , Ling Shao 2
Motivation:
作者认为从头开始训练太慢,但又怕失去精度,因此提出在backbone旁边加一个LSN网络,合并两者优点;并且觉得top-down的网络,只会把语义信息从高到低传播,因此,又提出bi-directional network。
Method:
作者设计了一个one-stage检测框架,它结合了微调预训练模型和从零开始训练的优点。该框架包括一个预训练过的标准backbone网络,一个轻量级的从零开始训练的辅助网络。此外,作者认为通常使用的自顶向下的金字塔表示只关注于将高级语义从顶层传递到底层,因此在检测框架中引入了一个双向网络,它可以有效地传递中低层次和高层次的语义信息。
Light-Weight Scratch Network(LSN):

SDS & LDS:
从主干网络中提取特征,在多个卷积块和最大池化层的重复堆叠中提取特征,以此产生语义信息丰富的特征。

这种特征提取方式有利于图像分类任务,因为分类任务要求的是平移不变性的即目标位置发生变化,最后输出的类别信息也应该一致。
但是在目标检测任务中,由于不仅仅有分类的要求,还需要进行目标的定位,因此更需要准确的轮廓信息,而特征中的低层,中层特征正是包含这种轮廓边缘信息,对于目标检测十分重要。
如下图,为了弥补主干网络在提取特征过程中的损失,本文提出了LSN特征提取方案。首先经过一个较大的下采样率进行池化操作,将输入图片的size调整到SSD中第一层的输入size,然后被送入到一个轻量级的连续操作LSO(Light-weight-serial operations)中去,LSO包括卷积层、BN层、ReLU层等结构。

bi-directional network:

Experiment:
好吧,还是直接上图:
【完结】
