Scale-Transferrable Object Detection & FSSD: Feature Fusion Single Shot Multibox Detector
基于尺度可扩展性物体检测的研究:上海交通大学发表于CVPR 2018会议中,并提出了一种名为STDN(基于尺度可变的物证检测网络)的新网络结构
主要采用SSD架构并将其vgg模块替换成densenet结构,并在此基础上提出了一种 novel 的Scale-Transfer Module(STModule)。该模块的具体实现方式是:首先从densenet的最后一层block中提取特征图,并对其进行尺寸转换操作;随后将这些转换后的特征图按照金字塔层级结构组织起来形成特征图金字塔;最后将此金字塔结构整合到目标检测任务中进行具体应用。 STModule在具体实现过程中采用了两个关键步骤:首先对各个通道的特征信息分别进行mean pooling运算;其次通过设计独特的融合机制将各通道信息整合成一个统一的特征表示空间。

实验结果:在PASCAL VOC2007数据集上 STDN 系列模型在测试集上的准确率表现优异,在 STDN_3 模型相较于 SSD-3 系列提升了约6%的检测精度,在 STDN_5 模型则较 SSD-5 系列提升了约1.4%的准确度,并且整体运行效率显著提升。具体而言,在该数据集上 STDN_系列模型的平均速度达到每秒 9 场次(FPS),并且其检测精度优于 DSS-D 系列模型,在测试过程中 STDN 的检测精度优于 DSS-D 模型,并且平均速度达到每秒 3 倍场次(FPS)。
2、FSSD: Feature Fusion Single Shot Multibox Detector 北航 物体检测 FSSD
本文对SSD和DSSD方案进行了优化。在传统的反卷积模块后进行特征图的拼接,在本方案中各层直接进行反卷积操作至一致的空间尺寸,在中间处理过程中未进行特征图的拼接操作;完成所有层的统一尺寸处理后,在特征图融合后再执行一次标准的卷积操作。


实验结果:PASCAL VOC 2007:FSSD512比DSSD513低0.6%,时间快30fps。比FSSD512比SSD512 高1.6%,速度快16.7fps。
