要約
協調フィルタリング (CF) は、最新のレコメンダー システムにおいて極めて重要な技術です。
CF モデルの学習プロセスは通常、相互作用エンコーダー、損失関数、ネガティブ サンプリングの 3 つのコンポーネントで構成されます。
多くの既存の研究では、高度なインタラクションエンコーダを設計するためのさまざまな CF モデルが提案されていますが、最近の研究では、損失関数を再定式化するだけで大幅なパフォーマンス向上が達成できることが示されています。
このペーパーでは、既存の損失関数間の関係の分析について詳しく説明します。
私たちの数学的分析により、以前の損失関数は整列関数と均一性関数として解釈できることが明らかになりました。(i) 整列はユーザーとアイテムの表現に一致し、(ii) 均一性はユーザーとアイテムの分布を分散します。
この分析からインスピレーションを得て、マージンを意識したアライメントと加重均一性 (MAWU) と呼ばれる、データセットの固有のパターンを考慮してアライメントと均一性の設計を改善する新しい損失関数を提案します。
MAWU の重要な新しさは 2 つあります。(i) マージンを意識した配置 (MA) は、ユーザー/アイテム固有の人気バイアスを軽減します。(ii) 加重均一性 (WU) は、ユーザーとアイテムの均一性の間の重要性を調整して、固有の特性を反映します。
データセットの特徴。
広範な実験結果は、MAWU を搭載した MF および LightGCN が、3 つの公開データセットでさまざまな損失関数を備えた最先端の CF モデルと同等またはそれより優れていることを示しています。
要約(オリジナル)
Collaborative filtering (CF) is a pivotal technique in modern recommender systems. The learning process of CF models typically consists of three components: interaction encoder, loss function, and negative sampling. Although many existing studies have proposed various CF models to design sophisticated interaction encoders, recent work shows that simply reformulating the loss functions can achieve significant performance gains. This paper delves into analyzing the relationship among existing loss functions. Our mathematical analysis reveals that the previous loss functions can be interpreted as alignment and uniformity functions: (i) the alignment matches user and item representations, and (ii) the uniformity disperses user and item distributions. Inspired by this analysis, we propose a novel loss function that improves the design of alignment and uniformity considering the unique patterns of datasets called Margin-aware Alignment and Weighted Uniformity (MAWU). The key novelty of MAWU is two-fold: (i) margin-aware alignment (MA) mitigates user/item-specific popularity biases, and (ii) weighted uniformity (WU) adjusts the significance between user and item uniformities to reflect the inherent characteristics of datasets. Extensive experimental results show that MF and LightGCN equipped with MAWU are comparable or superior to state-of-the-art CF models with various loss functions on three public datasets.
arxiv情報
著者 | Seongmin Park,Mincheol Yoon,Jae-woong Lee,Hogun Park,Jongwuk Lee |
発行日 | 2023-08-11 12:04:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google