Residual Attention Network for Image Classification, cvpr17
发布时间
阅读量:
阅读量
人至懒则无敌。
cvpr17的论文,很有意思,值得一读和复现。(笔者懒,还是坐等开源吧)
Residual Attention Network for Image Classification. In CVPR 2017.
该模型的结构参考了: Stacked hourglass networks for human pose estimation. In arXiv 2016. (笔者强烈推荐)
yangshuo的page: http://personal.ie.cuhk.edu.hk/~ys014/
还是老样子,看图说话,具体细节,请看论文。

图1说明了越high-level的part feature及其mask越会focus在object或者parts of object上。而且通过mask,可以diminish不相关的区域,如背景。

图2是网络架构,其关键点在于hourglass的attention map以及attention和trunck branches的residual connection。具体的细节和公式请看论文,容易理解。下面的图3比较详细地说明了soft mask branch和trunk branch是怎样的子结构。

至于效果嘛,看下面的tab 7

笔者简单套用了下residual这个方式,即(1+M(X))*T(X)到笔者的一个task上,发现是有1% 的提升的。
=====
如果这篇博文对你有帮助,可否赏笔者喝杯奶茶?

全部评论 (0)
还没有任何评论哟~
