论文crowd counting using scale-aware attention networks阅读笔记
论文地址: https://arxiv.org/pdf/1903.02025.pdf
代码:暂时没找到
创新点:
1。多分支尺度感知注意网络
2。尺度感知的注意力机制
3、尺度感知的loss
4.新的方法估计图片中人头尺寸
摘要
论文开发了一种新型的尺度感知注意力网络以应对图像中的尺度变化挑战。该网络借鉴了当前最前沿的注意力机制具备自动关注局部与全局尺度的能力研究者们证实该方法在多个基准数据集上的性能优于现有方案
一、简介
二、相关工作
三、我们的方法
crowd density is significantly influenced by the characteristics of different images. Even within the same image, variations in crowd density at different spatial positions exhibit notable differences. To capture crowd density changes across images and within the same image, we recommend incorporating both global and local attention weights.
3.2 全局尺度注意
作者利用了一个基于全局尺度的关注机制(GSA)模型来提取图片的稠密区域的整体背景信息。该模型以图片为输入,并能够获得三个注意力分数。每个分数对应三种预先设定好的密度等级:低、中、高。在多尺度特征提取模块中,所使用的密度等级数量等于所采用的尺度数量。
GSA对每个输入图像输出三个预测值g_i,代表
3、4 网络融合
记

代表3个不同尺度的特征图,

代表空间维度,

代表第i个特征图的通道数。我们用

分别代表相应的全局与局部注意得分,并且可以用它们来重新加权特征图;记住这一点。
尺度感知的loss:
从技术角度来看,在每一层中进行密度图计算时会估算出一定区域范围内的头部数量。具体而言,在该区域内被识别出的头部将被归类为"目标检测单元"(GI),而那些不符合该区域尺寸特征的人脸则被视为背景部分。这种划分方法的核心在于基于尺度感知机制的距离度量计算。
