Advertisement

EfficientDet: Scalable and Efficient Object Detection(BiFPN)

阅读量:

目录

    • EfficientDet: Scalable and Efficient Object Detection
      • BiFPN

EfficientDet: Scalable and Efficient Object Detection

EfficientDet: A Method That Is Both Scalable and Efficient for Object Detection.

在卷积神经网络中存在速度与精度之间的权衡关系。EfficientDet作为一个总称包含了不同版本的模型,在D1至D7的不同版本中(即从D1到D7),随着级数的增加(即随着级数递增),其速度逐渐变慢(速度减缓),但其精度逐步提升(精度提高)。

在这里插入图片描述

根据图表可知,在COCO基准测试集上的表现,“EfficientDet-D7”的参数规模达52 million、计算复杂度达325 billion的情况下,“平均精度”(AP)达到53.7分位数(NPU),代表当前最优水平。

BiFPN

EfficientDet-D7最重要的贡献就是提出了BiFPN的特征融合。

BiFPN

自FPN提出以来, 随着计算机视觉领域的深入研究, 各种基于'连环看'的思想提出的特征融合方法逐渐涌现. FPN通过自顶向下的信息传递机制实现了高层语义数据的有效整合, 而PAN则在这一框架下设计了一种反向传播机制, 使得低层的位置信息也能参与到高层语义信息的构建过程中. 这一发现也得到了学术界的广泛关注, 被研究者们形象地称之为'双塔结构'或'双向传播模型'. 其中一种改进型的变体——NAS-FPN采用了一种基于神经搜索优化的信息聚合方式, 并通过反复迭代更新来强化特征表达.

  • 根据作者的研究发现显示,在相同level层上使用BiFPN架构能够显著提升模型性能。这一发现表明,在相同level层上使用BiFPN架构能够显著提升模型性能。
  • 基于PAN架构去除了单输入节点设计,并认为该单输入节点对特征融合的贡献并不显著。
  • 为了整合更多的特征信息,在每个相同的level层中引入了一个skip connection。
  • 通过将自顶向下和自低向上的连接方式作为基础模块进行迭代构建,则能够形成完整的BiFPN特征融合网络。

以往的特征融合方法通常仅通过resize至同一尺度并应用卷积至相同通道数来实现融合,并通过concatenate或point-wise addition操作结合特征信息。然而这种方法会面临一个问题:即融合后的特征各分支权重相等。如果不对权重进行归一化处理到[0,1]区间内,则可能导致网络学习过程不稳定。

在这里插入图片描述

作者指出,在Softmax算法中存在指数运算这一特点。因此可能会对分类性能产生一定影响。于是尝试优化运算流程,并去掉与指数运算相关的步骤,在GPU平台上实现了约30%的速度提升的同时仅降低了约1%的性能水平。

在这里插入图片描述
在这里插入图片描述

最后来一个EfficientDet的整体架构图:

在这里插入图片描述

至此,BiFPN已经讲解完毕。Efficient内部还设计了一个针对Model Scaling的应用方案,“炼丹方”可能是作者通过大量模型实验得出的结论。如需进一步了解,请参考原文。

全部评论 (0)

还没有任何评论哟~