Zhuang SIGIR’20 Feature Transformation for Neural Ranking Models¶

著者 (全員 Google Research)

概要¶

この論文の貢献

特徴量の変換や正規化は基本的な手法だが、研究例が少なくそれがニューラルランキングモデルにどの程度の効果をもたらすかは不明
- -> LTRタスクで実験的にその疑問に答える
最適な性能をえるために、mixture transformationを提案する
- 基本的な特徴量変換を線形結合し、その重みも学習可能な変数として学習してしまうという手法
- -> 実験的にmixture transformationがNNランキングモデルの性能が大幅に向上することを示す

Gaussian transformation (z-score)

Notation

\begin{align} \sigma_{\text{Gauss},k} (x) := \frac{x - \hat{\mu_k} }{\hat{s_k}} \end{align}

CDF transformation

\begin{align} \sigma_{\text{CDF},k} (x) := \frac{ \sum_{x_i \in \mathcal{X}} \mathbb{I}(x_{ik} < x) }{|\mathcal{X}|} \end{align}

Symmetric log1p transformation

\begin{align} \sigma_{\text{Log1p},k} (x) := \text{sgn}(x) \cdot \log(1+|x|) \end{align}

\begin{align} \sigma_{\text{Mixture},k} (x) := \sum_{i=1}^{m} p_{i,k} \sigma_{i,k}(x) \end{align}

\(p_k := \text{softmax}(We_k)\) : m-dimensional weighting vector
- \(e_k\) : d-dimensional embedding vector (学習する)
- \(W: m \times d\) matrix (学習する)
気持ち: ランキングモデルと jointlyに学習することで、各特徴量に最適な変換を自動的に決定できる

Ranking Model

結果

mixture weights の可視化 (WEB30k)