Advertisement

论文题目:Relation Network for Person Re-identification

阅读量:

论文题目:Relation Network for Person Re-identification
来源:AAAI 2020
论文地址:https://arxiv.org/pdf/1911.09318v1.pdf
代码:https://github.com/cvlab-yonsei/RRID
**动机:**直接使用行人的部分层次特征,而不考虑身体各部位之间的关系,就容易把两张在对应部位具有相似特征的不同行人图片混淆。作者为了解决这个问题,提出了一种新的关系网络,该网络加入了身体局部特征和剩余其他部位特征之间的关系。
**解决思路:**在行人的高度上进行分割,提取行人图片不同部位的特征,也叫局部特征,将每个单独的局部特征和剩余的局部特征相关联,得到新的具有全局联系的局部特征,使得模型更加具有特征鉴别能力。
具体方法:
下图为作者使用的框架概览:在下图中,我们可以看出,行人的输入图像先经过一个resnet-50骨干网络,提取出特征图[H,W,C](分别表示高度,宽度,通道数)。为了提取局部特征,作者将特征图平分为6个水平的网格,经过最大池化得到6个局部特征图[1,1,c]。然后将得到的6个局部特征分别送入两个模块中。往下走的Global contrastive pooling(GCP)模块用来提取全局特征,往右走的One-vs-rest relational module为了提取新的局部特征。最后再将得到的新的6个局部特征和1个全局特征融合,送入网络训练。

接下来分别介绍GCP模块和One-vs-rest relational module。
1、 GCP

图1展示了GCP架构的详细过程。首先分别对之前的6个局部特征应用最大值池化和平均值池化操作。(其中核心特征Pmax忽略了其他边缘特征的影响;而平均特征Pavg又过于依赖边缘区域,在一定程度上引入了噪声信息)为此作者提出了一种改进方法:通过计算两者的差值得到局部差异特征求取差异度量结果即Pcont=Pavg-Pmax。(这种差异度量能够有效消除噪声干扰并突出人体关键部位)作者在实验中使用不同池化方法生成了四幅不同类型的特征图:图(a)为单均值池化的结果;图(b)为单最大值池化的结果;图(c)则展示了均值与最大值混合后的复合型区域;而图(d)则是通过均值减去最大值得到了差异型区域(绿色方框标识)。这一对比实验表明GCP方法能够有效提取人体关键部位而不受背景干扰的同时也验证了其有效性

获得了对比特征Pcont后,通过执行卷积操作获得其变形版本即为P¯cont同时对最大值特征求取其变化形式获得的结果记作P¯max将这两个变形后的特征求和后再次应用卷积运算以实现压缩效果即从2c缩减至c并在此基础上引入了一个跳跃连接模块借用了ResNet网络的核心思想最终输出的目标特征求得并标记为q0

2、one-vs-rest relation module

如下图所示的操作步骤分为以下几步(以P₁特征为例):
第一步:P₁通过一个卷积层输出为\overline{p}_1
第二步:除了P₁之外的剩余特征\{P_2, P_3, P_4, P_5, P_6\}求和得到r_1
第三步:将\overline{r}_1\overline{p}_1融合后通道数量增加至2C;随后对该结果进行卷积运算并与\overline{p}_1相加(类似于ResNet网络的思想),从而获得一个局部关系向量P₁_{loc}
第四步:对其他各特征\{P₂, P₃, P₄, P₅, P₆\}依次执行上述操作一至三步骤;最终可获得六个包含全局关系信息的局部关系特征

本文的核心思路在于综合考量局部与整体信息,并通过它们之间的关系(即论文标题所指)来提取更具鉴别力的特征和全局特征。该研究方法在实验验证中取得了与当前领域主流研究相媲美的效果。值得注意的是,在以往的研究中,主要关注点在于局部特征提取;然而随着研究的发展(此处可删去‘吧’),逐渐开始重视局部间关系的作用

全部评论 (0)

还没有任何评论哟~