[MSA-Net]Multi-Scale Attention Network学习笔记

阅读量：

MSA-Net

Multi-Scale Attention Network for Crowd Counting

2019

作者：亚马逊

论文：https://arxiv.org/abs/1901.06026

创新点：

在backbone中就产生了多尺度的density map，经过上采样后，加入软注意力机制进行加权叠加。
提出了一个scale-aware loss，但是实验结果好像表明效果不大。

Baseline network for crowd counting

一个关于密度图的解释[链接]

MSA-Net的baseline network由三部分组成：

backbone
regression head
上采样层

图片输入到backbone中，经过下采样卷积，得到一个大感受野但分辨率只有原图 $\frac{1}{16}$ 的feature map。之后输送到regression head中生成density map，regression head是输出单通道的卷积操作，经过上采样，产生一样大小的density map。其中所有的上采样都采用双线性插值bilinear。

训练时的Loss选取的是pixel-wise Euclidean Loss：

作者使用了MCNN的方法来生成GT的密度图，用高斯核来对每个人头进行模糊处理。

Scale-aware soft attention masks

在网络的前向传递过程中，每一层都产生density map，最后合并成一个。为了进行密度图的合并，作者在每一个尺度都加入了软注意力机制，具体来讲就是用相应的mask $M$ 与统一尺度下的密度图 $D$ 对应相乘，再求和，得到合成的density map：

关于 $M$ 的生成，是用到了卷积层的最后一层输出 $Z$ ，经过attention head得到的。attention head是将C通道的 $Z$ 转化为三通道，经过不改变通道数的上采样，产生1/4原图大小的3个mask，每个mask是归一化的：

Scale-aware loss regularization

在计算密度图时，作者提出了一个scale-aware loss，它的定义是

对于每一个尺度，该loss只在感兴趣的头部衡量预测的density map和gt density map之间的差距

另外，作者还引入了一个尺度监督的mask，它可以使每个头部在正确的尺度上被预测。综上，再引入一个正则化因子 $\lambda$ 最终的loss为

Estimating the size of each head

在人头检测器的基础上，作者利用几何自适应 $\eta_{GA}$ 和边框自适应 $\eta_{BB}$ 来估计人头大小，对于给定的人头 $\mathrm{h}_p$ ，如下估计人头半径

边框自适应 $\eta_{BB}$ 可以在大多数情况下进行较好的估计，但是当人头太小或者距离太近的时候，表现不佳，此时可以利用几何自适应 $\eta_{GA}$ 来进行估计

最终结果取两者的最小值，如果检测不到人头，那就直接用geometry-adaptive $\eta_{GA}$ 的结果，即 $\eta_{GA}$ 基本上对于远处人头影响不大，这样做主要克服了近处分散的大人头用geometry-adaptive会偏大的问题。

Experiment

采用了VGG16的backbone，比较三种contribution的效果，发现采用Multi density map+Mask-attention即（+M），以及Img Res（resize到1080P），带来的效果最明显，加了scale-aware loss效果不明显。

全部评论 (0)

还没有任何评论哟~

[MSA-Net]Multi-Scale Attention Network学习笔记

MSANet MultiScaleAttentionNetworkforCrowdCounting 2019 作者：亚马逊论文：https://arxiv.org/abs/1901.06026 创新...

每日Attention学习2——Multi-Scale Convolutional Attention

模块出处 [[link]]https://proceedings.neurips.cc/paperfiles/paper/2022/hash/08050f40fff41616ccfc3080e60a3...

GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing(ICCV2019)

1摘要我们提出了一个端到端可训练的卷积神经网络CNN，命名为GridDehazeNet，用于单幅图像去雾。GridDehazeNet由三个模块组成:预处理、主干和后处理。与由手动预处理方法产生的那些...

每日Attention学习5——Multi-Scale Channel Attention Module

模块出处 [[link]]https://openaccess.thecvf.com/content/WACV2021/html/DaiAttentionalFeatureFusionWACV2021...

DMSANet: Dual Multi Scale Attention Network（2021CVPR）双尺度注意网络论文笔记

DMSANet:DualMultiScaleAttentionNetwork 双多尺度注意网络 20216月份CVPR的一篇论文 PDF：https://arxiv.org/pdf/2106.0838...

每日Attention学习16——Multi-layer Multi-scale Dilated Convolution

模块出处 [CBM22][[link]]https://www.sciencedirect.com/science/article/pii/S0010482522009064 DoYouNeedSha...

Scale-Aware Attention Network for Crowd Counting 论文笔记

Summary：亚马逊提出：用于人群计数的尺度感知注意力网络 Author：Amusi Date：20190211 微信公众号：CVer 原文链接：亚马逊提出：用于人群计数的尺度感知注意力网络知乎：...

DehazeFlow: Multi-scale Conditional Flow Network for Single Image Dehazing （ACMMM 2021）个人学习笔记

摘要单图像去模糊是许多计算机视觉应用的一项关键的初步任务，在深度学习方面取得了进展。脱雾任务是一个不适定的问题，因为图像中的雾霾会导致信息的丢失。因此，对于雾图像的图像恢复有多种可行的解决方案。

论文阅读：GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing

文章目录引言一、概述二、网络架构残差密集块（RDB）基于注意力机制的特征值相加三、损失函数 SmoothL1Loss PerceptualLoss 引言论文链接：<https://arx...

SAR-Net: Multi-scale Direction-aware SAR Network via Global Information Fusion

Q:这篇论文试图解决什么问题？ A:这篇论文试图解决使用合成孔径雷达（SAR）图像进行物体检测时的两个主要问题：1如何有效地整合局部和全局信息，特别是方向感知特征；2如何处理SAR图像中物体的多尺度和...

是否确定退出登录?

[MSA-Net]Multi-Scale Attention Network学习笔记

MSA-Net

Baseline network for crowd counting

Scale-aware soft attention masks

Scale-aware loss regularization

Estimating the size of each head

Experiment

全部评论 (0)

相关文章推荐

[MSA-Net]Multi-Scale Attention Network学习笔记

每日Attention学习2——Multi-Scale Convolutional Attention

GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing(ICCV2019)

每日Attention学习5——Multi-Scale Channel Attention Module

DMSANet: Dual Multi Scale Attention Network（2021CVPR）双尺度注意网络论文笔记

每日Attention学习16——Multi-layer Multi-scale Dilated Convolution

Scale-Aware Attention Network for Crowd Counting 论文笔记

DehazeFlow: Multi-scale Conditional Flow Network for Single Image Dehazing （ACMMM 2021）个人学习笔记

论文阅读：GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing

SAR-Net: Multi-scale Direction-aware SAR Network via Global Information Fusion