【论文笔记】AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network for FGVC

阅读量：

task

Fine-Grained Visual Classification（细粒度视觉分类），以下简称FGVC。
相较于传统的目标检测和分类，有如下两个难点：

1.高类内方差（high intra-class variance）：
图片中属于同一类别的对象通常呈现显著不同的姿态和视角。

2.低类间方差（low inter-class variance）：
下属类（例如哈士奇和金毛两个下属类，都属于狗这一超类）之间的视觉差异往往是微妙的，因为它们属于同一超类别。

数据集

当前细粒度分类的主流数据集有三个：

CUB-200-2011：鸟类数据集，200类11788张图像，每张图像包含15各部位的位置信息。（位置信息主要给基于部件的网络模型训练用）
Stanford Cars：汽车数据集，196类16185张图像，不包含部件信息。
FGVC-Aircraft：飞机数据集，102类10200张图像，不包含部件信息。

近两年大部分细粒度分类论文都以上述三个数据集作为benchmark。

AP-CNN

2021年2月刊登在IEEE的一篇细粒度分类的文章。
论文地址（下载需要校园网）
源码地址

整体结构
在这里插入图片描述

1、主要改进

1）Attention Pyramid（注意金字塔）

在FPN的基础上，对每一层feature map都使用注意力机制，形成一个自下而上的注意力层级结构，作者给其取名为 注意金字塔（Attention Pyramid） ，这个结构中每一层又包含两个部分，分别是 空间注意 和 通道注意 ，生成过程如下图所示：
在这里插入图片描述

每一层的通道注意由FPN中对应层的Feature map进行一次全局平均池化和两次全连接而成。
公式如下：

$A^{(c)}_k=\sigma(W_2\cdot ReLU(W_1\cdot GAP(F_k)))$

空间注意则由对应的Feature map进行一次3*3的反卷积，再做sigmoid而成。
公式如下：

$A^{(s)}_k=\sigma(v_c*F_k)$

而空间注意通常的做法 是对特征层进行最大池化 和平均池化 ，之后把这俩结果进行堆叠，再做1*1卷积，然后sigmoid，最后和原特征层相乘即可。

这个部分作者没有做消融实验，我认为作者是想要和之前已经存在的CBAM进行区别，所以进行反卷积，魔改了一下😓。

想要了解注意力机制原理的读者可以参考：注意力机制的实现

2） ROI引导的细化模块

流程图：
在这里插入图片描述
以上述注意金字塔得到的空间注意 $A^{s}_{k}$ 作为掩膜，在每一层都生成对应数量的ROI（region of interest）,效果如下：

之后根据这些生成的ROI做基于ROI的Dropblock和Zoom-in（过程省略，因为非常简单），得到最终的特征map $Z_k$ .

最后再对 $Z_k$ 做一次分类，将这次的结果和初始FPN经过注意力后得到的分类结果进行平均，得到最终结果。

2、与主流模型比较

3、可视化

首先在训练时加上可视化选项，cd到AP-CNN目录下，激活对应环境，输入：

复制代码

    python -m vindom.server
    
    
    python

在本机指定的窗口（官方初始定义为8097）
出现如下提示：
在这里插入图片描述
浏览器打开本机对应端口：

然后训练文件，输入：

复制代码

    python train.py --visualize
    
    
    python

记得要带上可视化选项。
如下提示，则开始训练。

此时观察到浏览器端口页面变为训练与测试图像的ROI和三层mask展示：

（顺序被我不小心打乱了😓，我还不会恢复…）

4、总结

本文其实没有任何的创新点，作者将空间注意 和通道注意 在FPN每一层都进行运用，得到了相较于baseline：NTS 在CUB-200-2011上0.9个点的精度提升。
lego的方法值得学习和应用😏

全部评论 (0)

还没有任何评论哟~

【论文笔记】AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network for FGVC

目录 task 数据集 APCNN 1、主要改进 1）AttentionPyramid（注意金字塔） 2）ROI引导的细化模块 2、与主流模型比较 3、可视化 4、总结 task FineGraine...

AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network论文复现

这是21年发表在IEEE上的一篇关于弱监督注意力金字塔卷积神经网络用于细粒度识别的一篇论文的代码。论文地址:<https://ieeexplore.ieee.org/document/9350209...

论文笔记《IS object localization for free? Weakly-supervised learning with convolutional neural network》

motivation 作者指出对于检测来说，一般需要更多的标注信息，检测的效果才会好，但是标注信息需要浪费人工去标注，代价大，同时，也会加入标注者的主观信息，更重要的是标注信息并不是对所有的图片中的物...

【论文笔记】Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detecti

WeaklySupervisedLearningBasedonCoupledConvolutionalNeuralNetworksforAircraftDetection 基于耦合卷积神经网络的弱监督...

【论文阅读笔记】【ARXIV2105】An Efficient Pyramid Split Attention Block on Convolutional Neural Network

源文https://arxiv.org/abs/2105.14447源代码https://github.com/murufeng/EPSANet Introduction Model PyramidS...

【论文笔记】：Pyramid Feature Attention Network for Saliency detection

&Title PyramidFeatureAttentionNetworkforSaliencydetection 代码 &Summary 在显著性检测算法中，如何提取到更有效的特征是该任务的难点之一...

论文学习笔记： Convolutional Neural Pyramid for Image Processing

论文学习笔记：ConvolutionalNeuralPyramidforImageProcessing 原文链接：ConvolutionalNeuralPyramidforImageProcessin...

63_RS-CNN: Relation-Shape Convolutional Neural Network for Point Cloud Analysis 2019 论文笔记

RSCNN:RelationShapeConvolutionalNeuralNetworkforPointCloudAnalysis 基于邻域集合关系推断的点云卷积神经网络论文地址 https://...

论文笔记：Switching Convolutional Neural Network for Crowd Counting

SwitchingConvolutionalNeuralNetworkforCrowdCounting 概要文章提出了一种人群计数模型，实现了从密集人群图像到其密度分布的映射。

Switching Convolutional Neural Network for Crowd Counting-论文笔记

SwitchingConvolutionalNeuralNetworkforCrowdCounting：用于人群计数的转换卷积神经网络 SwitchingConvolutionalNeuralNetw...

是否确定退出登录?

【论文笔记】AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network for FGVC

目录

task

数据集

AP-CNN

1、主要改进

1）Attention Pyramid（注意金字塔）

2） ROI引导的细化模块

2、与主流模型比较

3、可视化

4、总结

全部评论 (0)

相关文章推荐

【论文笔记】AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network for FGVC

AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network论文复现

论文笔记《IS object localization for free? Weakly-supervised learning with convolutional neural network》

【论文笔记】Weakly Supervised Learning Based on Coupled Convolutional Neural Networks for Aircraft Detecti

【论文阅读笔记】【ARXIV2105】An Efficient Pyramid Split Attention Block on Convolutional Neural Network

【论文笔记】：Pyramid Feature Attention Network for Saliency detection

论文学习笔记： Convolutional Neural Pyramid for Image Processing

63_RS-CNN: Relation-Shape Convolutional Neural Network for Point Cloud Analysis 2019 论文笔记

论文笔记：Switching Convolutional Neural Network for Crowd Counting

Switching Convolutional Neural Network for Crowd Counting-论文笔记