Advertisement

【论文阅读】Richer Convolutional Features for Edge Detection(2017)

阅读量:

Liu, Y., Cheng, M. M., Hu, X., Wang, K., & Bai, X. (2017). Richer convolutional features for edge detection. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3000-3009).
原文地址
代码地址

文章目录

  • 摘要

  • 模型

    • 1.模型结构
    • 2.损失函数
    • 测试时的多尺度融合技巧
  • 结果


摘要

  • 提出一个利用丰富卷积特征的模型RCF。现实物体具有不同的尺度与纵横比,因此模型学习丰富层次结构的能力在边缘检测任务中十分关键,提出的模型通过整体得结合卷积特征,能够有效利用物体不同层次、尺度的特征实现边缘分割。
  • 在BSDS500 ODS F-measure of 0.811 速度8 FPS;更快的版本在30FPS的基础上实现ODS F-measure of 0.806。

模型

1.模型结构

在这里插入图片描述
与VGG16的区别:

  • 去掉全连接层与pool5层
  • 所有层与1x1x21的卷积层相连接,并相加再与一个1x1x1卷积层连接
  • 利用反卷积层deconv进行上采样
  • 所有上采样恢复的特征图concat连接进行,生成最后边缘检测图

2.损失函数

损失函数依旧是:
在这里插入图片描述
总的损失函数是5个stage损失与融合损失之和:
在这里插入图片描述

测试时的多尺度融合技巧

在这里插入图片描述
人为把resize到0.5, 1.0, and 1.5,进行边缘检测,再将输出图利用双线性插值上采样到原图大小,最后取平均得到最后结果。

这个操作我觉得可以有两个改进方向:

  • 既然双线性插值可导,上面整个图都可以直接作为模型的一部分,进行训练
  • 模型仅仅用的是单一尺度的数据训练,然而测试竟然用不同尺度的图像,没有道理。理应将模型多次训练,适应不同尺度的图像才有道理。

结果

可视结果:
在这里插入图片描述
在这里插入图片描述

量化结果:
在这里插入图片描述
PR曲线:
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~