Advertisement

【目标检测系列:七】Cascade R-CNN: High Quality Object Detection and Instance Segmentation

阅读量:

2018 CVPR

CASCADE R-CNN: The exploration of cascade r-cnn in high-quality object detection
and its application in high-quality object detection and instance segmentation.](https://arxiv.org/abs/1906.09756)

High Quality Object Detection and Instance Segmentation

  • Introduce

    • Cascade RCNN
    • Cascade Mask RCNN
  • EXPERIMENTAL RESULTS

  • Pytorch

  • References


Introduce

检测=分类+定位

在这里插入图片描述

确定正样本的过程通常是通过计算anchor box与ground truth之间的IOU(交并比),当其超过某个指标(通常是0.5)时就被视为正样本。较低的阈值可能会导致出现大量重复且无用的边界框,这些情况可被视为噪声。

在这里插入图片描述

那检测中的IoU阈值选取高可以吗?

越容易得到高质量的样本

但是一味选取高阈值会引发两个问题,导致训练出的 detector 效果下降[1]

在这里插入图片描述

在训练过程中减少样本数量可能导致模型过拟合现象的发生 (如图所示为训练集经过RPN筛选后生成的目标框与真实标注对象之间IoU分布曲线图中当IoU值增大时正样本比例呈现指数级下降趋势的现象)。其中用红色标记标注出的数值代表每个对应IoU阈值下的正样本比例数值。

在这里插入图片描述
  • 在训练(train)和推理(inference)过程中采用不同阈值设置会导致...
    即通过维持较低的训练阈值并在推理阶段采用较高阈值的方式,则检测器输出的结果处于次优状态,并将其定义为推理阶段的时间失配问题[1]。

发现:
①在测试过程中采用较大的阈值属于次优策略;即通过该策略计算得到的检测器(detector)平均精度(AP)会出现下降(以红线标注);
②通过低阈值训练得到的检测器(detector)在处理低交集-并集率(IoU)样本时表现出更好的效果;而通过高阈值训练得到的检测器则在处理高IoU样本时表现出更好的效果。

在这里插入图片描述

如何在阈值适中的情况下训练出效果最好 的detector呢?

  • 该检测器在IoU接近预设阈值时对目标框(bbox)表现出最佳效果;当IoU阈值设定为0.7时,在输入的目标框IoU同样为0.7的情况下取得最大提升效果[1]*
在这里插入图片描述

在一个网络中进行一次级联结构(串联使用多个不同阈值的Threshold-based detector)比Iterative BBox(串联使用同一个detector)的效果要显著得多,并且该方法能够有效避免将高IoU的bbox回归到低IoU的位置[1]。如下图所示,在输入IOU值为0.55的情况下,分别使用蓝色、绿色和红色的Threshold-based detector相比连续三次使用蓝色detector的效果更好[1]。

在这里插入图片描述

Cascade RCNN

1个RPN+3个检测器(阈值设定分别为0.5/0.6/0.7)

在这里插入图片描述
在这里插入图片描述

iteratively conducted during the inference phase
Three identical heads, each denoted as H₁, are employed in this framework
For a specific IOU threshold, such as 0.5, this configuration is deemed optimal
However, during the inference stage, an IOU value exceeding 0.5 is considered suboptimal
Similarly, when cascading through subsequent stages

(c)Integral Loss

不同IOU阈值的分布是不均衡的, 所以 损失是不均衡的[2]

在这里插入图片描述

(d)Cascade RCNN

在这里插入图片描述

cascaded regression持续影响着proposal的空间分布特征,并通过调节权重参数实现有效的样本再平衡。cascaded方案在训练与推理过程中均被采用,在处理复杂场景时表现出良好的稳定性与鲁棒性。各独立检测器在重采样后均能完美适应当前样本分布情况,并未出现识别偏差现象[3]

迭代边界框回归

在这里插入图片描述
在这里插入图片描述

Cascade Mask RCNN

基于实例分割技术的主要代表之一是 Mask R-CNN ,此外还包括其改进版本 PANet 以及 Mask Scoring RCNN 等相关算法。
通过引入类似于 Mask R-CNN 的分支结构 ,将 Cascade R-CNN 架构应用至具体实例分割任务上以实现进一步的性能提升 。

在这里插入图片描述

Cascade R-CNN包含多个检测分支,并针对以下两个问题进行了改进:
1)引入了新的分割分支位置
针对三种不同的mask预测策略,在 Cascade R-CNN 的不同级联层级分别增加了单独的 mask预测head(b)、(c)。
2)引入了新的分割分支
在每个级联阶段增加了分割分支(d),增强了用于学习mask预测任务样本的多样性。

实验表明,Cascade Mask R-CNN的这些架构优于Mask R-CNN。

EXPERIMENTAL RESULTS

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Pytorch

https://github.com/guoruoqian/基于Cascade-R-CNN的PyTorch实现
https://github.com/leowangzi/基于CascadeRCNN的GitHub存储库

References

[1] http://www.mclover.cn/blog/index.php/archives/247.html
[2] https://arleyzhang.github.io/articles/1c9cf9be/
[3]

(最新版论文目前能找到的一篇翻译)

全部评论 (0)

还没有任何评论哟~