notes/ReID/Centroids.md at master · jyj369/notes · GitHub

贡献
提出的方法
架构

paper: https://arxiv.org/pdf/2104.13643v1.pdf
code: https://github.com/mikwieczorek/centroids-reid

贡献

引入了Centroid Triplet loss
在度量的时候引入class centroids
在多个数据集(fashion retrieval和person re-identification)上获得了SOTA的结果

提出的方法

背景

在进行度量的时候，查询时通常都是基于instance的，查询的数据库中通常有对应类别的多张图片(包括不同视图或者是不同光线等的图片)；
这样的方式能够提升一定的召回率，但通常提高召回率的操作都会降低准确率；
随着数据库样本的增加，可能会存在不同类别的不同实例的某些细节信息可能更像当前识别的类别图片；
所以作者提出融合每个instance的特征成为一个class centroid来提高模型的鲁棒性；
当然也有一些方法提出使用centroid来训练triplet loss，但是这也仅仅在训练的时候采用，推理查询的时候还是基于instance的；

Centroid Triplet Loss

原始Triplet loss
Centroid Triplet Loss
其中c_p和c_N分别为positive的centroid和negative的centroid

Aggregating item representations

由于训练时候的min-batch每个类别包含M个samples，总共包含P个类别，总共的batch-size为PxM
其中class centroidc_kp(也就是上述的c_p和c_N)就由min-batch中同一类别的sample(除去当前的q_k)计算的
计算公式如下
- 训练时：
- 其中S_k = {x1₁,...x_M}表示某个类别samples的特征向量, q_k表示当前计算的sample；
- 评估时：
- 其中G_k是数据库当中类别k的所有sample集

架构