深度学习论文: GiraffeDet: A Heavy-Neck Paradigm for Object Detection及其PyTorch实现
在深度学习领域研究中,《GiraffeDet》提出了一种基于‘重链式架构’的目标检测框架及其PyTorch实现。在-depth learning research中,《GiraffeDet》 introduced a novel 'heavy-neck architecture' framework for object detection and its PyTorch implementation.
1 概述
GiraffeDet采用了极轻的主干与深度兼备的巨大颈部模块组合。其独特的结构设计能够支持不同尺度及层次的密集信息交互。这种创新性的设计架构使得检测器能够在网络早期阶段实现相同优先级下的高效高级语义处理与基础空间信息整合,在检测任务中的效率更高。
2 GiraffeDet
GiraffeDet整合了轻量化的space-to-depth链路、广义FPN模块以及预测网络组件,在沿袭了现有的检测设计思路基础上实现了更为高效的多尺度特征融合能力

2-1 Space-to-Depth Chain (S2D Chain)
具体来说,S2D操作是通过将空域信息移动至深度维度,并且能够实现无参数下采样功能

Pytorch代码:
def space2depth(x, size=(2, 2)):
b, c, h, w = x.shape
rh, rw = size
oh, ow = h * rh, w * rw
oc = c // (rh * rw)
# view
x = x.view(b, oc, rh, rw, h, w)
x = x.permute(0, 1, 4, 5, 2, 3).contiguous()
# flatten
x = x.view(b, oc, oh, ow)
return x
代码解读
Space-to-Depth链(S2D链)被视为一种轻量级的关键路径,在深度学习模型中占据重要地位。其中包含两个连续的三维卷积层以及堆叠而成的S2D链模块。具体而言,在整个网络架构中,三维卷积层首先负责初步的空间降采样,并通过逐层递进的方式引入丰富的非线性特征。每个S2D链模块由一个三维空间转换层和一个压缩层构成,在此过程中空间到深度转换得以逐步深化。压缩层则通过通道相关的池化操作提取出固定维度的空间特征向量。

2-2 Generalized-FPN
如图所示为FPN、PANet、BiFPN及GFPN的对比实验结果图,在结果显示中可以看出FPN架构主要集中在特征融合方面,并缺乏内部连接机制。

跨尺度融合Queen-fusion:
- Queen-fusion不仅具备跳层连接这一特点,并且还配备了跨尺连接来解决大规模的变化问题。
- 通过双线性插值和最大值池化技术来实现特征的上采样和下采样过程。

2-3 GiraffeDet
下图给出了S2D chain-BiFPN-D29以及S2D-chain GFPN-D11的架构示意图

3 Experimental
在具体实现方面,GiraffeDet基于GFocalV2构建了检测模块,并通过ATSS实现目标标注。为了提升模型从零开始训练的稳定性与可靠性,本研究引入了多尺度特征提取技术。

