贡献

验证一些论文提出的tricks
提出了BNNeck模块
验证了batch-size与image size对ReID模型的影响(详细见论文实验部分), 较大的batch-size效果更好，而image size则在实验中的设置表现上都差不多

Standard Baseline

ResNet-50
B(batch-size) = P(number of identities) x K(number of sample/id), baseline中P=16, K=4
input size=256x128
每张图片随机水平翻转，p=0.5
image归一化到[0,1], 再标准化
triplet loss的margin设置为0.3
学习率初始化为0.0035, 然后在40th和70th时除以10，总共训练120epochs

Training Tricks

Warmup Learning Rate
- 其中t为轮次
Random Erasing Augmentation
- 随机擦除数据增强
Label Smoothing
- 原始cross entropy loss(下面所说的ID loss就是多分类损失)
- 由于度量学习在测试验证的时候需要分辨没有在训练集中出现的sample，所以防止度量模型的过拟合也是很重要的
- 所以引入label Smoothing
Last Stride=1
- 将ResNet50中最后一次下采样(last stride=2)的步长设置为1
- 送入256x128的图片到网络，会输出8x4的特征图
- 设置last stride=1得到16x8的特征图，增加少量的计算量，但是有较明显的精度提升
BNNeck
- ID loss(回归损失) 构造多个超平面，将嵌入空间分隔为不同的子空间, 每个类别的特征将分布到不同的子空间; 推理时余弦距离比欧几里得距离更适合作为度量标准；
- Triplet loss增强了欧氏空间中类内紧性和类间可分性, 但由于Triplet loss 不能提供全局最优约束，类间距离有时小于类内距离
- 所以通常的做法是将triplet loss和ID loss结合在一起使用，但是由于两种loss的优化空间又是不一致的，所以训练的时候优化是次优的；
- 如下图所示：
- 为了处理该问题，论文提出BNNeck，在特征后面添加一层BN层(classifier FC layers前面), 这样在该BN层前后的两部分特征f_t和f_i就用来优化triplet loss和ID loss
- 如下图所示：
- 由于超球体几乎与坐标轴原点对称，BNNeck的另一个技巧是消除分类器FC层的bias。
Center Loss
- 由于triplet loss考虑的是positive pair和negative pais的距离差值，而不关心positive pair和negative pair的值本身，例如d_p=0.3, d_n=0.5与d_p=1.3, d_n=1.5的差值是一样的；
- triplet loss每次只比较随机两个人的IDs，要想优化整个训练集的d_p < d_n 还是比较困难
- 所以添加center loss来考虑每个样本之间的距离
- 最终的loss为：
  - 其中β=0.0005

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

BoT.md

BoT.md

贡献

Standard Baseline

Training Tricks

实验

Files

BoT.md

Latest commit

History

BoT.md

File metadata and controls

贡献

Standard Baseline

Training Tricks

实验