Advertisement

【行人重识别】A Discriminatively Learned CNN Embedding for Person Re-identification

阅读量:

A discriminative approach to learning CNN embeddings is employed for person re-identification.

link: https://arxiv.org/abs/1611.05666

Author: Zhedong Zheng, Liang Zheng and Yi Yang

Code: https://github.com/layumi/2016_person_re-ID

Author email: zdzheng12@gmail.com

Homepage: http://zdzheng.xyz

欢迎关注知乎专栏 行人重识别

这篇 行人重识别 paper主要ague的是

1. verification label 为0,1二值。如果输入的两张图片为同一人,则为1,否则为0。

值得注意的是,在本研究中发现该标签相对不足。原因在于该标签未能充分地充分利用完整数据集中的标注信息(在每一批次中仅考虑了两个或三个样本之间的关系,并采用了对比损失函数和三元组损失函数作为评估指标)。

identity标识为身份标识(Identity),例如,在Market1500数据集中包含749个身份标识,在该数据集中对应着749个标签。其中包含749个身份标识,在该数据集中对应着749个标签。此标签强度高(strong),基于数据集原始的标注信息

如图所示,在分析身份认证模型(Verification Model)时,该模型明确地考虑了样本间的相似性;然而该模型未能充分挖掘所有标签的信息。

就针对身份分类模型(classification model),在同一批次中同时处理BP过程。其潜在机制自然地综合了类内样本在高维空间表现出相似性以及类别间的判别性要求。

于是提出的模型融合了这两种loss。

3. 网络模型如何

其主要采用了加权融合的方法将原始的两个损失函数结合在一起,并对其融合后的模型进行了优化。在反向传播过程中,通过指定权重系数同步地调整两种损失函数的梯度以优化网络结构。

位于篮筐中的网络结构等同于原来经过fine-tuning的分类模型,在此之后会用于识别身份标签

其中Square Layer 即相当于对每个元素层次上应用简单的欧氏距离计算。从而得到一个向量结果。然后使用该向量结果来进行验证标签预测。

4.classification和verification谁贡献更大?为什么融合以后好了?

研究者进一步对比了仅单一模型性能的表现,并旨在确定哪一种表现更为优异。在实验结果中分类模式略显优势

在融合之后, 如图所示, 我们可以从图中可以看出两个网络各自学到了不同的attn. 当after fusion, the proposed model显示出其对注意力机制的整合.

结果显示,在market1501上进行的无监督聚类实验中得到的效果图表明能够提取出一组具有判别性的特征。

P.S. 尽管 Camera6 为较低分辨率的摄像头,并且提出的 embedding 并未受到显著的影响。(与原始数据集中的 His 结果相比确实有所提升。。)

全部评论 (0)

还没有任何评论哟~