Kim CVPR’20 Proxy Anchor Loss for Deep Metric Learning

https://arxiv.org/abs/2003.13911

著者 (全員 POSTECH, Pohang, Korea)

  • Sungyeon Kim

  • Dongwon Kim Minsu Cho

  • Suha Kwak

概要

  • \(\mathcal{P}^+, \mathcal{P}^-\) : ミニバッチ内のデータのクラスのproxyの集合, ミニバッチ内のデータには存在しないクラスのproxyの集合

  • \(\mathcal{X}^+_p, \mathcal{X}^-_p\) : ミニバッチ内のproxy pと同じクラスのembeddingの集合, ミニバッチ内のproxy pとは違うクラスのembeddingの集合

  • \(\alpha\) : スケーリングパラメータ (ハイパーパラメータ)

\begin{align} L_{PA}(\mathcal{X}) := \cfrac{1}{|\mathcal{P}^+|} \sum_{p \in \mathcal{P}^+} \log \left(1 + \sum_{x \in \mathcal{X}^+_p} \exp(-\alpha (s(p, x) - m )) \right) + \frac{1}{|\mathcal{P}^-|} \sum_{p \in \mathcal{P}^-} \log \left(1 + \sum_{x \in \mathcal{X}^-_p} \exp(\alpha (s(p, x) + m )) \right) \end{align}

著者らの主張

../_images/pa_f2.png
  1. Triplet : 組み合わせの総数多すぎ、学習に効くペアを見つけられていない

  2. N-pair : Tripletより一度に全体を見れるが、データ全体とは言えない

  3. Lifted Structure: N-pairよりよいが、まだ全体ではない

  4. Proxy-NCA: 収束ははやいが、データ全体の情報は使えていない (a-cようなリッチなペア組み合わせ)

  5. Proxy Anchor: Proxyも使うし、 a-cのようなサンプル間のペアも学習に使う

Cars196での実験

  • 収束がはやいし、精度も高い

../_images/pa_f1.png

実験

  • 実験設定そろってない論文?

CUB-200 & Cars196

../_images/pa_t2.png

SOP

../_images/pa_t3.png