Advertisement

深度学习论文: SFPN: Synthetic FPN for Object Detection及其PyTorch实现

阅读量:

深度学习领域中,《SFPN:一种合成式特征金字塔网络用于目标检测及其在PyTorch框架中的实现》

1 概述

SFPN通过对特征图进行大小调整(包括缩放到1/2、1/3、1/4及1/6等比例),以减轻因尺度截断带来的负面影响。研究者发现,在轻量化架构中加入中间尺度的特征图有助于缓解不同尺寸之间的转换问题,并在此基础上构建了一个仅有三层输出层的基础模型。随后,在这一框架上逐步引入中间比例层级以进一步优化性能。

2 SFPN (Synthetic Fusion Pyramid Network)

CNN Backbone中使用的池化操作(或配合使用的stride=2卷积)通常会将图像的空间尺寸减半,在x轴和y轴方向上的尺度分别变为原来的二分之一、四分之一和八分之一直等比例。研究者指出这种做法可能导致尺度跳跃过大,从而使得不同层次之间的特征信息难以实现平滑整合。为此,在原始的不同层级之间构建了一系列复合层级,在这些新的合成层中预测图像则被调整到二分之一大小、三分之一大小以及四分之一大小等多种比例。这种做法能够有效拓展出一个更加平滑的变化尺度空间以适应目标检测中不断变化的尺度需求

2-1 Synthetic Fusion Module (SFM)

SFM包含三个可选的输入参数:首先是经过线性比例缩放的第一个输入通道;接着会对每个像素位置进行加法操作;随后会将其与一个3\times 3卷积模块进行深度结合处理。此外,在实际应用中该模块不仅可以从原始特征图生成新的合成特征图;还可以直接应用于特征融合的过程以提升模型性能。

在这里插入图片描述

2-2 Synthetic Fusion Block (SFB)

SFM集合体通过构建多个SFM模型实现信息整合功能。其机制可被描述为将输入数据划分为两组层次:首先,在第一组层次内完成局部特征提取;随后,在第二组层次内完成全局信息融合;最后再将融合结果反推至第一层次进行细节优化。
该方法既实现了自上而下的信息聚合能力又具备自下而上的特性。
通过重复应用一层或多层SFM结构即可实现多次特征融合过程。

在这里插入图片描述

2-3 Synthetic Fusion Pyramid Network (SFPN)

我们将其被称为合成融合金字塔网络(SFPN),因为它是通过将SFB组件叠加3次而得到的结果;同时,具有X个输出层的这类网络则统称为SFPN-X。

在这里插入图片描述

2-4 Naive Anchors for SOL

将SFPN与YOLO-Head进行融合。

在这里插入图片描述

3 Experimental

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~