【论文阅读笔记】【ARXIV2105】An Efficient Pyramid Split Attention Block on Convolutional Neural Network
发布时间
阅读量:
阅读量
[源文

https://arxiv.org/abs/2105.14447](https://arxiv.org/abs/2105.14447)[源代码

https://github.com/murufeng/EPSANet](https://github.com/murufeng/EPSANet)
Introduction
Model

Pyramid Split Attention (PSA)基于SENet提出了一种多尺度特征提取机制,其整体架构图如图所示。主要包含以下四个方面的内容:
- 分割与合并(SPC)模块负责生成空间级多尺度特征图;
- SEModule在SE-Net中被用来生成空间级视觉注意力向量以抽取多尺度响应目标的特征;
- 通过Softmax函数对特征图的权重进行重新分配;
- 通过元素-wise乘法将权重向量与原始特征图结合生成最终的结果响应图。
SPC module

如上图所示,在ESPANet-small框架下,默认设置下各卷积层分别采用不同的参数设置。其中主干网络层主要采用单个分支结构进行特征提取;而分支网络层则分别对应多个分支架构进行信息融合。
SEWeight module

ESPNet
在ESPANet架构中,在图中展示的为该模块的具体设计。相较于ResNet而言,则采用了PSA模块替代传统的3×3卷积,在此结构下构成了完整的ESPANet单元。


Experiment
Image Classification on ImageNet

Object Detection on MS COCO

全部评论 (0)
还没有任何评论哟~
