https://arxiv.org/abs/2003.13911
著者 (全員 POSTECH, Pohang, Korea)
Sungyeon Kim
Dongwon Kim Minsu Cho
Suha Kwak
\(\mathcal{P}^+, \mathcal{P}^-\) : ミニバッチ内のデータのクラスのproxyの集合, ミニバッチ内のデータには存在しないクラスのproxyの集合
\(\mathcal{X}^+_p, \mathcal{X}^-_p\) : ミニバッチ内のproxy pと同じクラスのembeddingの集合, ミニバッチ内のproxy pとは違うクラスのembeddingの集合
\(\alpha\) : スケーリングパラメータ (ハイパーパラメータ)
著者らの主張
Triplet : 組み合わせの総数多すぎ、学習に効くペアを見つけられていない
N-pair : Tripletより一度に全体を見れるが、データ全体とは言えない
Lifted Structure: N-pairよりよいが、まだ全体ではない
Proxy-NCA: 収束ははやいが、データ全体の情報は使えていない (a-cようなリッチなペア組み合わせ)
Proxy Anchor: Proxyも使うし、 a-cのようなサンプル間のペアも学習に使う
Cars196での実験
収束がはやいし、精度も高い
実験設定そろってない論文?
CUB-200 & Cars196
SOP