Interaction-and-Aggregation Network for Person Re-identification
行人重识别之网络设计
Interaction-based and Aggregation-based Network for the Person Re-Identification Problem
长时间未在行人的网络架构上进行相关研究的文章指出:该研究针对行人重识别中图像空间位置不匹配问题而设计了一个SIA模块;同时为提取图像细节特征开发了一个CIA模块;两者的整合形成了一个高效且低资源消耗的IA模块,在深度学习框架中可无缝集成;实验结果令人满意。
SIA:
SIA主要包含两个方面:外观关联部分和位置关联部分。
外观关联部分:
从图中可以看出,在每一张特征图中都需要对每个像素进行处理,并计算其与其它像素在外观上的相关程度。具体而言,我们通过计算每一点与其他各点之间乘积的关系来构建一个红色区域映射图(红色map)。然而由于单个像素受限于视野范围较小的特点,在实际操作中我们采用了2x2和3x3大小的不同区域映射图(黄色区域和蓝色区域),将这些不同大小区域映射图相乘得到的就是整体上的外部关联映射结果(即最终生成的结果中的红色区域)。因此最终生成的结果图中每一行对应于特征图中该特定位置与其他所有位置之间的关联情况。
位置关联部分:
如果输入特征图共有c个通道,则最终系统会输出c个不同颜色(或灰度)的整体关联映射结果。

位置关系部分:
仅考虑外观特征而忽略位置信息的不足之处在于未能全面反映物体间的相互作用特性。因此作者进一步计算了各点之间的位置相关性。其实这一过程较为简单,并可直接应用高斯分布模型来描述其关联性特性,在此基础上再结合归一化方法即可完成处理工作。具体而言,这两个点分别通过高斯分布模型计算其位置关联程度,并采用归一化方法处理以获得标准化的相似度指标。


计算完这两个部分,就可以进行SIA最后的运算:

通过采用两个映射的部分进行点与点之间的乘法运算,在处理原始特征图F时进行了加权处理,从而得出了新的特征图E。
通过SIA,网络能够自动发掘图像的结构信息。此外,该方法对于行人姿态和尺度的变化表现出一定的鲁棒性。
如图所示,在行人图像中选取任意五个关键点后进行处理,在经过SIA算法计算后能够生成相关度热图。从中可以看出该网络模型能够在一定程度上识别出这些关键区域。

CIA:
作者认为,在高级的特征图中,每个通道都承载着特定的意义。因此挖掘各条通道间的联系有助于提取这些意义。从而帮助我们识别图像中的物品如书包、鞋子和腰带等。这一观点尚有不足之处,但其应用价值不容忽视。

如
最后,在实验中作者进行了整合处理

综上所述,在网络架构设计方面的文章虽然其理论基础相对较为浅显,但却涉及诸多细节部分往往涉及诸多考量与优化空间。例如,在网络架构中添加多个Identity Assertion(IA)时,需细致斟酌其位置以及在每个Identity Attribute(IA)中SIB(Service Identity Block)与CIB(Client Identity Block)的排列顺序,以确保系统性能的最优配置。与此同时,这些决策背后所体现出来的系统思维与技术直觉,正是我们作为一名技术人员应当不断强化自身系统的分析与构建能力的关键所在。由此可见,在撰写高质量技术文章时,除了扎实的专业知识储备外,还需要我们具备一定的技术写作素养才能完成一篇经得起推敲的文章作品。希望这些经验分享能对读者有所帮助!
完
欢迎讨论 欢迎吐槽
