Pre-trained Neural Recommenders: A Transferable Zero-Shot Framework for Recommendation Systems

要約

最新のニューラル協調フィルタリング技術は、電子商取引、ソーシャル メディア、コンテンツ共有プラットフォームの成功に不可欠です。
ただし、技術の進歩にもかかわらず、新しいアプリケーション ドメインごとに、NCF モデルを最初からトレーニングする必要があります。
対照的に、事前トレーニングされた視覚および言語モデルは、日常的にさまざまなアプリケーションに直接 (ゼロショット) または限られた微調整で適用されます。
事前トレーニングされたモデルの影響に触発され、補助的なユーザー情報やアイテム情報を使用せずに、再トレーニングを最小限またはまったく行わずに、新しいドメインでのレコメンダー システムの構築をサポートする事前トレーニング済みレコメンダー モデルの可能性を探ります。
重複するユーザーやアイテムがない場合、データセット全体でユーザーとアイテム間の関連付けを形成できないため、補助情報のないゼロショット レコメンデーションは困難です。
私たちの基本的な洞察は、ユーザーとアイテムの相互作用マトリックスの統計的特徴は、さまざまなドメインやデータセットにわたって普遍的に利用できるということです。
したがって、ユーザーとアイテムの相互作用行列の統計的特性を使用して、ユーザーとアイテムのデータセットに依存しない表現を特定します。
二部構成のユーザーとアイテムの相互作用グラフからノードとエッジの普遍的な (つまり、ユーザーやアイテムの補助情報なしでゼロショット適応をサポートする) 表現を学習する方法を示します。
ユーザーとアイテムの限界、クラスターのサイズと密度分布などのインタラクション データの統計的特性を利用して表現を学習します。

要約(オリジナル)

Modern neural collaborative filtering techniques are critical to the success of e-commerce, social media, and content-sharing platforms. However, despite technical advances — for every new application domain, we need to train an NCF model from scratch. In contrast, pre-trained vision and language models are routinely applied to diverse applications directly (zero-shot) or with limited fine-tuning. Inspired by the impact of pre-trained models, we explore the possibility of pre-trained recommender models that support building recommender systems in new domains, with minimal or no retraining, without the use of any auxiliary user or item information. Zero-shot recommendation without auxiliary information is challenging because we cannot form associations between users and items across datasets when there are no overlapping users or items. Our fundamental insight is that the statistical characteristics of the user-item interaction matrix are universally available across different domains and datasets. Thus, we use the statistical characteristics of the user-item interaction matrix to identify dataset-independent representations for users and items. We show how to learn universal (i.e., supporting zero-shot adaptation without user or item auxiliary information) representations for nodes and edges from the bipartite user-item interaction graph. We learn representations by exploiting the statistical properties of the interaction data, including user and item marginals, and the size and density distributions of their clusters.

arxiv情報

著者 Junting Wang,Adit Krishnan,Hari Sundaram,Yunzhe Li
発行日 2023-09-29 15:54:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク