Replace Scoring with Arrangement: A Contextual Set-to-Arrangement Framework for Learning-to-Rank

要約

ランク付けの学習は、上位 N レコメンデーション タスクの中核となる手法であり、理想的なランカーはアイテム セットから配置へのマッピング (別名順列) になります。
既存のソリューションのほとんどは、確率的ランキング原理 (PRP) のパラダイムに当てはまります。つまり、最初に候補セット内の各項目にスコアを付けてから、ソート操作を実行して上位ランキングのリストを生成します。
ただし、これらのアプローチでは、個々のスコアリング中に候補項目間の文脈依存性が無視され、並べ替え操作は微分不可能です。
上記の問題を回避するために、私たちは Set-To-Arrangement Rank (STARank) を提案します。これは、個別のスコアリングや並べ替え操作を必要とせずに、候補アイテムの順列を直接生成する新しいフレームワークです。
そしてエンドツーエンドで微分可能です。
その結果、STARank は、アイテムのグラウンド トゥルース関連性スコアへのアクセスを必要とせず、グラウンド トゥルースの順列のみにアクセスできる場合に動作できます。
この目的のために、STARank はまずユーザーの閲覧履歴のコンテキストで候補アイテムを読み取り、その表現が Plackett-Luce モジュールに入力されて、指定されたアイテムがリストに配置されます。
STARank を監視するために指定されたグラウンド トゥルース順列を効果的に利用するために、Plackett-Luce モデルの内部一貫性特性を活用して、計算効率の高いリストごとの損失を導き出します。
2 つのランク付け学習ベンチマーク データセットと 3 つのトップ N の実世界推奨データセットに関する 9 つの最先端の手法との実験比較により、従来のランキング指標に関して STARank の優位性が実証されました。
これらのランキング メトリクスでは、リスト内の項目間のコンテキスト依存の影響が考慮されていないことに注意してください。既存のメトリクスを特殊なケースとみなすことができる、シミュレーション ベースのランキング メトリクスの新しいファミリーを設計します。
STARank は、PBM および UBM シミュレーションベースのメトリクスに関して、一貫して優れたパフォーマンスを達成できます。

要約(オリジナル)

Learning-to-rank is a core technique in the top-N recommendation task, where an ideal ranker would be a mapping from an item set to an arrangement (a.k.a. permutation). Most existing solutions fall in the paradigm of probabilistic ranking principle (PRP), i.e., first score each item in the candidate set and then perform a sort operation to generate the top ranking list. However, these approaches neglect the contextual dependence among candidate items during individual scoring, and the sort operation is non-differentiable. To bypass the above issues, we propose Set-To-Arrangement Ranking (STARank), a new framework directly generates the permutations of the candidate items without the need for individually scoring and sort operations; and is end-to-end differentiable. As a result, STARank can operate when only the ground-truth permutations are accessible without requiring access to the ground-truth relevance scores for items. For this purpose, STARank first reads the candidate items in the context of the user browsing history, whose representations are fed into a Plackett-Luce module to arrange the given items into a list. To effectively utilize the given ground-truth permutations for supervising STARank, we leverage the internal consistency property of Plackett-Luce models to derive a computationally efficient list-wise loss. Experimental comparisons against 9 the state-of-the-art methods on 2 learning-to-rank benchmark datasets and 3 top-N real-world recommendation datasets demonstrate the superiority of STARank in terms of conventional ranking metrics. Notice that these ranking metrics do not consider the effects of the contextual dependence among the items in the list, we design a new family of simulation-based ranking metrics, where existing metrics can be regarded as special cases. STARank can consistently achieve better performance in terms of PBM and UBM simulation-based metrics.

arxiv情報

著者 Jiarui Jin,Xianyu Chen,Weinan Zhang,Mengyue Yang,Yang Wang,Yali Du,Yong Yu,Jun Wang
発行日 2023-08-25 07:59:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク