【Person Re-ID】In Defense of the Triplet Loss for Person Re-Identification

阅读量：

paper下载地址：https://arxiv.org/abs/1703.07737

代码仓库访问链接https://github.com/VisualComputingInstitute/triplet-reid

Introduction

本文主要针对triplet loss进行优化改进：其中 hardest mining 是其核心环节，在 hard-example 的选取过程中存在若干问题：

该方法耗时较长且难以明确界定"good"类型的difficult triplets。
选取过于复杂的例子可能导致训练过程不稳定。
当训练数据规模较大时, 系统可能无法充分覆盖所有潜在的triplets。

Learning Metric Embeddings

这一节主要介绍集中metric learning方法

Large Margin Nearest Neighbor loss

其中 $L_{pull}$ 负责将属于同类别的样本进行聚拢,而 $L_{push}$ 则致力于将不同类别间的样本拉开距离.基于所采用的是最近邻方法,因此在同类别中可能存在多个聚类区域.

Triplet loss

Triplet loss是人脸识别与认证中最常用的loss，其形式为

其中 $D_{a,p}$ 和 $D_{a,n}$ 分别代表锚点与positive样本以及negative样本之间的距离。通过triplet loss机制,锚点与同类样本的距离应显著小于异类样本的距离。其主要缺点在于,当训练数据规模极大时,几乎难以实现有效的学习效果.这是因为大量简单的（易区分）样例掩盖了具有挑战性的（半硬）样例的存在。

在典型的triplet loss架构中，在实际应用中通常会将一个三元组输入至网络进行处理。当batchsize设为3B时，则每个batch能生成B个有效的triplets。然而这种方式往往会导致资源的过度消耗。因为理论上来讲最多能达到 $6B^{2}-4B$ 个triplets（当所有可能的正样本和负样本都被穷尽地组合时），而实际上由于算法设计和计算效率的限制，并非都能被合理利用）。因此这种做法在实际应用中往往会导致资源的巨大浪费

Batch Hard Triplet loss

其中一种改进方法是在批次中随机选择P个类别，在每个类别中随机选取K张图片并按类别顺序排列。对于每个样本，在其同类中的最远邻居作为正样本，在异类中最近邻居作为负样本形成三元组用于损失计算。从而生成PK个有效的损失项

Batch All Triplet loss

另外一种改进方法是将一个batch中的每一个positive pair都纳入考虑范围，在此基础上生成相应的triplets数量为 $PK(PK-K)(K-1)$ 个

但是该改进方案涉及每一个batch中的所有锚点-正样本对（anchor-positive pair），因此计算量极大。随着训练进入后期阶段后，在已有大量样本被准确分类的情况下（虽然这些样本已经达到了预期目标），会导致产生大量'冗余'的数据（redundant data），从而掩盖了大量重要的hard exam样本。

Lifted Embedding loss

该损失函数通过考虑到所有不属于positive pair的负样本来计算，并通过优化损失函数边界使其更加平滑

可想而知，这个loss的计算也是非常耗时的。

作者对这个loss的推广是

该损失不仅包含了所有反例，在同一类别中的每个锚-正对都会被包含。

Distance Measure

在本文所述的方法中，在作者所采用的所有度量方式中（即全部），这些均未进行平方处理，并且都被视为距离；具体而言，在数学表达上表现为 $\left | a-b \right |_{2}$ 的形式。

Soft-margin

在hinge loss函数中，在于 $\begin{bmatrix} m+D \end{bmatrix}$ $_{+}$ 这一项设计能够有效防止修正那些‘已经被正确识别’的triplet组（即实施硬截止策略）。然而作者采用了软加性函数（softplus function） $ln(1+exp(D))$ 这一更平滑的版本。其目的是使‘已经被正确识别’的triplet组更接近真实类别，并且消除了超参数margin设置对模型性能的影响。该方法被称为soft-margin损失函数。

Experiments

作者的实验分为两个阶段：首先是对各类triplet loss架构进行性能考察；其次是在person-ReID场景下挑选表现优异的triplet loss架构展开测试。其中一部分采用了预训练模型与从零开始训练的方法。

Training

该研究团队采用了在ImageNet上经过训练的ResNet-50模型，并对其顶层进行了替换；随后接入了BN归一化层和平移激活函数；该研究团队采用了在ImageNet上经过训练的ResNet-50模型，并对其顶层进行了替换；随后接入了BN归一化层和平移激活函数；并将其命名为TriNet.

Trained from Scratch ： 作者称之为LuNet。

基于 $L_{tri}$ 的硬负样本未被有效挖掘时（即没有Hard Mining），模型的整体表现较差。当引入简单的离线硬负采样方法（OHM）后，在多数情况下能够提升性能但也会偶尔出现不稳定的情况。
在对比实验中发现Batch Hard形式（BH）的整体表现优于Batch All形式（BA）。通过观察发现，在训练后期阶段很多三元组损失值为零的情况会显著影响整体效果。为了验证这一假设（即大部分损失值为零会稀释有用信息），作者采用了仅计算非零损失值的方法重新评估，并观察到这种修正确实能提高性能。
在作者设计的重识别实验中使用批 hard 加工并结合软边距策略取得了最优效果（即Batch Hard + soft-margin表现最好）。然而该结论仅适用于当前研究场景下的实验验证，在其他潜在的任务应用中仍需进一步验证其适用性。

在 Market-1501 数据集上, pritrained model 取得了 rank-1=84.92% 的优异成绩, 经过 re-ranking 处理后, 进一步提升了至 86.67%. 相比而言, pretrained 的性能略高于 trained from scratch, 具体数值相差约 2%至3%. 需要注意的是, pretrained 模型在输入尺寸方面存在一定的限制, 如果对其进行修改可能会产生相反的效果（如表所示）. 训练自_scratch 则无需此类限制, 因此其通用性更强

参考

【1】<>

全部评论 (0)

还没有任何评论哟~

【Person Re-ID】In Defense of the Triplet Loss for Person Re-Identification

paper下载地址：<https://arxiv.org/abs/1703.07737 code下载地址：<https://github.com/VisualComputingInstitute/tr...

Re-ID阅读笔记（二）：《In Defense of the Triplet Loss for Person Re-Identification》

水平有限，疏漏之处在所难免，欢迎大家批评指正论文作者:AlexanderHermans（亚琛工业大学）论文链接：《InDefenseoftheTripletLossforPersonReIdent...

【Person Re-ID】Deep Representation Learning with Part Loss for Person Re-Identification

paper下载地址：<https://arxiv.org/abs/1707.00798 Introduction PersonReID需要解决什么问题？测试集中的人在训练集中是不可见的，因此需要学习...

Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification

论文：<https://arxiv.org/pdf/2103.04607.pdf 问题对于跨膜态难样本三元组损失，在一批中选择P个身份ID，对每个ID随机选择K张可见图像和K张红外图像。这样的采样策...

【Person Re-ID】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

paper下载地址：<https://arxiv.org/abs/1710.00478 Introduction PersonReID目前依然是一项十分具有挑战的任务。姿势，视角，光照，背景和遮挡都给...

【Person Re-ID】AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

paper下载地址：<https://arxiv.org/abs/1711.08184 Introduction 大多数基于CNN的方法都是学习全局特征，而忽略了人的结构性。因此带来的缺陷是：行人检...

【Person Re-id】A Discriminatively Learned CNN Embedding for Person Re-identification

1.verificationmodel:同时输入imagepairs，network预测输入图片是否为同一个人，将问题当成一个二分类来看。这样导致没有完全用到标注信息，imagepairs和数据集中的...

person re-identification (re-ID)论文学习

前言大家好，这里是不会写代码的biter，今天想跟大家分享的是ZhedongZheng和LiangZheng大佬在2016年的文章《ADiscriminativelyLearnedCNNEmbedd...

论文阅读31 | Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification

论文：UnifiedBatchAllTripletLossforVisibleInfraredPersonReidentification 一、创新点本文的创新点在于使用余弦距离对现有的三种损失函数...

行人重识别（Person Re-Identification, Re-ID）

行人重识别（PersonReIdentification,ReID）行人重识别（PersonReIdentification,ReID）行人重识别（PersonReIdentification,R...

是否确定退出登录?

【Person Re-ID】In Defense of the Triplet Loss for Person Re-Identification

Introduction

Learning Metric Embeddings

Large Margin Nearest Neighbor loss

Triplet loss

Batch Hard Triplet loss

Batch All Triplet loss

Lifted Embedding loss

Distance Measure

Soft-margin

Experiments

Training

参考

全部评论 (0)

相关文章推荐

【Person Re-ID】In Defense of the Triplet Loss for Person Re-Identification

Re-ID阅读笔记（二）：《In Defense of the Triplet Loss for Person Re-Identification》

【Person Re-ID】Deep Representation Learning with Part Loss for Person Re-Identification

Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification

【Person Re-ID】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

【Person Re-ID】AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

【Person Re-id】A Discriminatively Learned CNN Embedding for Person Re-identification

person re-identification (re-ID)论文学习

论文阅读31 | Unified Batch All Triplet Loss for Visible-Infrared Person Re-identification

行人重识别（Person Re-Identification, Re-ID）