Advertisement

【论文阅读笔记】【ARXIV2105】An Efficient Pyramid Split Attention Block on Convolutional Neural Network

阅读量:

[源文

icon-default.png?t=L9C2

https://arxiv.org/abs/2105.14447](https://arxiv.org/abs/2105.14447)[源代码

icon-default.png?t=L9C2

https://github.com/murufeng/EPSANet](https://github.com/murufeng/EPSANet)

Introduction

Model

Pyramid Split Attention (PSA)基于SENet提出了一种多尺度特征提取机制,其整体架构图如图所示。主要包含以下四个方面的内容:

  1. 分割与合并(SPC)模块负责生成空间级多尺度特征图;
  2. SEModule在SE-Net中被用来生成空间级视觉注意力向量以抽取多尺度响应目标的特征;
  3. 通过Softmax函数对特征图的权重进行重新分配;
  4. 通过元素-wise乘法将权重向量与原始特征图结合生成最终的结果响应图。

SPC module

如上图所示,在ESPANet-small框架下,默认设置下各卷积层分别采用不同的参数设置。其中主干网络层主要采用单个分支结构进行特征提取;而分支网络层则分别对应多个分支架构进行信息融合。

SEWeight module

ESPNet

在ESPANet架构中,在图中展示的为该模块的具体设计。相较于ResNet而言,则采用了PSA模块替代传统的3×3卷积,在此结构下构成了完整的ESPANet单元。

Experiment

Image Classification on ImageNet

Object Detection on MS COCO

全部评论 (0)

还没有任何评论哟~