论文笔记 | R-FCN: Object Detection via Region-based Fully Convolutional Networks

阅读量：

Authors

Jifeng Dai，Yi Li，Kaiming He，Jian Sun
这里写图片描述
代季峰
代码里还有百度云盘的连接，为国人考虑的真周到~
（更新，作者又给出了end2end版本，现有三版code 包括mxnet版： https://github.com/daijifeng001/R-FCN ）

Abstract

本文提供了region-based，fully convolutional networks，用于快速精确的目标检测。Fast或者Faster在per-region的时候都需要subnetwork很多次，比如region通过fc层，本文希望可以将几乎所有的计算都可以共享。提出了position-sensitive score maps来处理图像分类时的translation-invariance和目标识别时的translation-variance。R-FCN可以将ResNet等全卷积图片分类器转换为目标识别用。可以达到比faster rcnn快2.5-20倍。

1 Introduction

现有的目标检测网络大多数分为两部分：全卷积网络+RoIl之后的不再进行计算共享的网络。但是现在的state of the art 图片分类的网络ResNet,googlenet都是全卷积网络（googLeNet在训练时不是）。我们想在目标检测方面也利用全卷积网络，但是之前的尝试都是精度比较差，在ResNet的文章里<>，插入了RoI pooling layer 提高了精度，可是却降低了速度，因为在计算每一个RoI时计算不共享（下图是fast的，faster多了RPN）。
这里写图片描述
我们需要设置RoIl-wise subnetwork的原因是图像分类时的translation-invariance和目标识别时的translation-variance的矛盾：
1. 图像分类，希望图片中的物体无论怎么变化都可以被识别，深度卷积网络在这方面做的很好；
2. 在object detection中，物体的定位是需要translation-variance，比如目标变动的时候需要产生与candidate box的相应的合理关系。

复制代码

    Locally adaptive learning for translation-variant MRF image priors

而我们推测越深的卷积网络对于translation越不敏感。

本文提出了一种Region-based Fully Convolutional Network (R-FCN)，其结构是FCN中的一种，为了将translation variance 包含进FCN，我们用FCN的输出设计了一组 position sensitive score maps，它包含物体的位置信息，其顶端设有RoI Poolinglayer 来处理位置信息，之后再没有权重层

2 our approach

这里写图片描述

骨架：ResNet101去掉global average和分类用的fc层，添加一个1024d的1x1conv layer来降低维度，然后加了 $k^2(C+1)$ 通道的conv layers 来产生 score maps。
Position sensitive score maps and RoI pooling :最后的卷积层对每一个类别都产生k^2个score maps ，对于第（i,j）个pool bin里数值信息都只对应着第（i,j）个score map：
这里写图片描述
之后计算平均分：之后计算softmax得分，用于计算cross-entropy loss及RoIs rank。
在之后的Bounding box regression也是类似，对每一个RoI产生一个 $4k^2$ 的向量，类似的最后使用平均voting产生一个4d向量，分别代表左上角坐标及长和宽。
灵感来源：

复制代码

    J. Dai, K. He, Y. Li, S. Ren, and J. Sun. Instance-sensitive fully convolutional networks. arXiv:1603.08678,
    2016.

Training 和fast rcnn类似，loss 分为两部分：
这里写图片描述
正例需要是与ground truth iou大于0.5的。
本文这种方法还可以比较容易的运用于online hard example mining。

复制代码

    A. Shrivastava, A. Gupta, and R. Girshick. Training region-based object detectors with online hard example
    mining. In CVPR, 2016.

weight decay 0.0005
momentum 0.9
image:600 p
each GPU:1 image and selects B=128 ROIS for backprop
微调：0.001 lr for 20k mini-batches 0.0001 for 10k mini-batches
RPN：4 step alternating
Inference 如Faster rcnn，我们估计了300个rois每张图片，最后使用non-maximum suppression来postprocessed（0.3 IoU）
À trous and stride ：由ResNet101的32 p的stride变为16 pixels，增加了score map的分辨率，前四个阶段的stride不变，第五阶段由stride=2变为1，其filter使用hole algorithm修改，其map可提高2.6个百分点：
这里写图片描述

复制代码

    S. Mallat. A wavelet tour of signal processing. Academic press, 1999
    L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy, and A. L. Yuille. Semantic image segmentation with
    deep convolutional nets and fully connected crfs. In ICLR, 2015.

为了便于与faster rcnn比较其RPN由第4阶段的输出conv来计算。
visualization
这里写图片描述

4 试验对比

这里写图片描述
VS Faster Rcnn

深度的影响

region proposals的影响

5 conclusion

Authors
Abstract
Introduction
our approach
试验对比
conclusion

全部评论 (0)

还没有任何评论哟~

R-FCN论文笔记（R-FCN: Object Detection via Region-based Fully Convolutional Networks）

前言较早的目标检测算法，比如SPPnet，FastRCNN和FasterRCNN，它们的网络结构可以通过RoI池化层分为两个子网络：一个是独立于RoI，共享计算的全卷积子网络，其实这部分就是对整个图...

R-FCN: Object Detection via Region-based Fully Convolutional Networks 论文笔记

论文链接：论文代码：代码论文提出了一种基于region，但使用全卷积架构的目标检测算法。与传统的Fast/FasterRCNN相比，其移除了全连接层，改用卷积层，因为在整张图像上共享计算，故可有效...

论文笔记 | R-FCN: Object Detection via Region-based Fully Convolutional Networks

Authors JifengDai，YiLi，KaimingHe，JianSun 代季峰代码里还有百度云盘的连接，为国人考虑的真周到（更新，作者又给出了end2end版本，现有三版code包括mx...

R-FCN: Object Detection via Region-based Fully Convolutional Networks

RFCN:ObjectDetectionviaRegionbasedFullyConvolutionalNetworks 背景介绍 RCNN系列的方法，如SPPnet、FastRCNN、FasterR...

R-FCN: Object Detection via Region-based Fully Convolutional Networks

RFCN:ObjectDetectionviaRegionbasedFullyConvolutionalNetworks 论文下载地址源码地址本篇论文是微软亚研何凯明代季峰的团队做的工作，虽然何凯...

R-FCN: Object Detection via Region-based Fully Convolutional Networks

这篇博客主要讲述基于RCNN框架的另一个变种的目标检测方法，名为RFCN:ObjectDetectionviaRegionbasedFullyConvolutionalNetworks，这篇论文提出的...

（R-FCN）R-FCN: Object Detection via Region-based Fully Convolutional Networks论文阅读笔记

文章目录 RFCN:ObjectDetectionviaRegionbasedFullyConvolutionalNetworks论文阅读笔记2016 Abstract 1\.Introduction...

[论文阅读]R-FCN: Object Detection via Region-based Fully Convolutional Networks

arxiv上的一篇新论文，出自MSRA，目前还没有发表，今天刚读完，文章的缺点还要想一想，有空更新。原文链接：点击打开链接本文是基于regionbasedframework的一种新的detectio...

【R-FCN】Object Detection via Region-based Fully convolutional Networks && light-head RCNN

一、RFCN 1、概述本文作者JifengDai，YiLi，KaimingHe，JianSun。本文主要是在特征的通道维度上分块后，每一块取空间上某一部分组合成新的featuremap来解决分类需空...

Artical Analysis (AA): R-FCN: Object Detection via Region-based Fully Convolutional Networks

RFCN:ObjectDetectionviaRegionbasedFullyConvolutionalNetworks 作者：JiFengDai,YiLi,KaimingHe,JianSun 短评：...

是否确定退出登录?

论文笔记 | R-FCN: Object Detection via Region-based Fully Convolutional Networks

Authors

Abstract

1 Introduction

2 our approach

4 试验对比

5 conclusion

全部评论 (0)

相关文章推荐

R-FCN论文笔记（R-FCN: Object Detection via Region-based Fully Convolutional Networks）

R-FCN: Object Detection via Region-based Fully Convolutional Networks 论文笔记

论文笔记 | R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks

（R-FCN）R-FCN: Object Detection via Region-based Fully Convolutional Networks论文阅读笔记

[论文阅读]R-FCN: Object Detection via Region-based Fully Convolutional Networks

【R-FCN】Object Detection via Region-based Fully convolutional Networks && light-head RCNN

Artical Analysis (AA): R-FCN: Object Detection via Region-based Fully Convolutional Networks