Skip to content

Latest commit

 

History

History
47 lines (38 loc) · 2.27 KB

Centroids.md

File metadata and controls

47 lines (38 loc) · 2.27 KB

贡献

  1. 引入了Centroid Triplet loss
  2. 在度量的时候引入class centroids
  3. 在多个数据集(fashion retrieval和person re-identification)上获得了SOTA的结果

F1

提出的方法

背景

  • 在进行度量的时候,查询时通常都是基于instance的,查询的数据库中通常有对应类别的多张图片(包括不同视图或者是不同光线等的图片);
  • 这样的方式能够提升一定的召回率,但通常提高召回率的操作都会降低准确率;
  • 随着数据库样本的增加,可能会存在不同类别的不同实例的某些细节信息可能更像当前识别的类别图片
  • 所以作者提出融合每个instance的特征成为一个class centroid来提高模型的鲁棒性
  • 当然也有一些方法提出使用centroid来训练triplet loss,但是这也仅仅在训练的时候采用,推理查询的时候还是基于instance的;

Centroid Triplet Loss

  • 原始Triplet loss e1
  • Centroid Triplet Loss e2
  • 其中cp和cN分别为positive的centroid和negative的centroid

Aggregating item representations

  • 由于训练时候的min-batch每个类别包含M个samples,总共包含P个类别,总共的batch-size为PxM
  • 其中class centroidckp(也就是上述的cp和cN)就由min-batch中同一类别的sample(除去当前的qk)计算的
  • 计算公式如下
    • 训练时: e3
    • 其中Sk = {x11,...xM}表示某个类别samples的特征向量, qk表示当前计算的sample;
    • 评估时: e4
    • 其中Gk是数据库当中类别k的所有sample集

架构

F2