Musgrave ECCV’20 A Metric Learning Reality Check¶

著者

概要¶

Fig. (a)は、各々の論文中で報告されているP@1
- Constractive, Triplet, Semihard Miningについては、すべての論文の平均を取っている

ハイパーパラメータチューニングがされていない/不十分
実験設定が揃っていない
- Network Achitecure
  - GoogleNet < ResNet50なのに既存法はGoogleNet使っていたりとか
- Optimizer choice (SCD, Adam, RMSprop,…) and learning rate
- Data augmentationなどの細かいテクニック

ImageNetで事前学習したBN-Inception network (embedding dim=128)
batchsize = 32
- embedding lossでは、8クラスごとに4sample
- classification lossでは、32クラスごとに1sample
学習中、画像はrandom resized cropping strategyを使って augmentationされる
- 短辺の長さが256になるようにリサイズして
- 40~256の間のサイズ、3/4 ~ 4/3の間のアスペクト比になるようにランダムなクロップをする
- このクロップは227 × 227 にリサイズされ、50%の確率で左右反転する
OptimizerにはRMSpropを使う (学習率1e-6)
- SGDより収束がはやく、Adamより精度がよかった
Embeddingはロス計算と評価の前にL2正規化する

各クラス前半のデータをcross validation用に、後半のデータをtest用に使う
- cross validation用のデータを4つにわけて、そのうちの3つをtraining、1つをvalidationに使う
- validation dataのaccucaryが停滞したら、学習をストップする
Bayesian Optimization (50 iterations) でbestなやつを探す
- validation accuracyの平均が一番高いやつを採用する
- BOの具体的な手法のことは書いてない
- https://kevinmusgrave.github.io/powerful-benchmarker/papers/mlrc/#optimization-plots からplotが見れる
  - https://kevinmusgrave.github.io/powerful-benchmarker/papers/mlrc_plots/cub_contrastive.html

cross validation用のデータを4つに分割するので、4つのモデル(Embedding)ができるので、次の2つのやり方で性能評価する

CUB200

Cars196

Stanford Online Products(SOP)