Improving Content Recommendation: Knowledge Graph-Based Semantic Contrastive Learning for Diversity and Cold-Start Users

要約

データの希薄性、コールドスタートの問題、レコメンデーション システムの多様性に関連する課題に対処することは、極めて重要かつ困難です。
現在のソリューションの多くはナレッジ グラフを活用して、アイテムベースとユーザーアイテムの両方の協調シグナルを組み合わせてこれらの問題に取り組んでいます。
これらのアプローチに共通する傾向は、モデルの複雑さの増大、多様性の削減、タスクの複雑化を犠牲にして、ランキングのパフォーマンスを向上させることに重点を置いています。
クリックスルー率やリコールなどの高いランクベースのパフォーマンスの達成だけに依存するのではなく、パーソナライズされた多様なレコメンデーションを提供することが不可欠です。この論文では、ハイブリッド マルチタスク学習アプローチを提案します。
ユーザーとアイテム、アイテムとアイテムのインタラクションに関するトレーニング。
説明テキストにアイテムベースの対比学習を適用し、アイテムのメタデータに基づいて正と負のペアをサンプリングします。
私たちのアプローチでは、テキストからの意味情報を利用することで、モデルがナレッジ グラフ内のエンティティ間の関係をよりよく理解できるようになります。
これにより、より正確で関連性が高く、多様なユーザー推奨が実現され、アイテムとのやり取りがほとんどないコールドスタート ユーザーにもメリットが広がります。
私たちは、アプローチの有効性を検証するために、広く使用されている 2 つのデータセットに対して広範な実験を実行しました。
私たちの調査結果は、概要テキストを使用してユーザーとアイテムのインタラクションとアイテムベースのシグナルを共同トレーニングすることが非常に効果的であることを示しています。
さらに、私たちの結果は、均一性や整合性などの指標で示されるように、アイテムベースの対照学習がエンティティ埋め込みの品質を向上させるという証拠を提供します。

要約(オリジナル)

Addressing the challenges related to data sparsity, cold-start problems, and diversity in recommendation systems is both crucial and demanding. Many current solutions leverage knowledge graphs to tackle these issues by combining both item-based and user-item collaborative signals. A common trend in these approaches focuses on improving ranking performance at the cost of escalating model complexity, reducing diversity, and complicating the task. It is essential to provide recommendations that are both personalized and diverse, rather than solely relying on achieving high rank-based performance, such as Click-through Rate, Recall, etc. In this paper, we propose a hybrid multi-task learning approach, training on user-item and item-item interactions. We apply item-based contrastive learning on descriptive text, sampling positive and negative pairs based on item metadata. Our approach allows the model to better understand the relationships between entities within the knowledge graph by utilizing semantic information from text. It leads to more accurate, relevant, and diverse user recommendations and a benefit that extends even to cold-start users who have few interactions with items. We perform extensive experiments on two widely used datasets to validate the effectiveness of our approach. Our findings demonstrate that jointly training user-item interactions and item-based signals using synopsis text is highly effective. Furthermore, our results provide evidence that item-based contrastive learning enhances the quality of entity embeddings, as indicated by metrics such as uniformity and alignment.

arxiv情報

著者 Yejin Kim,Scott Rome,Kevin Foley,Mayur Nankani,Rimon Melamed,Javier Morales,Abhay Yadav,Maria Peifer,Sardar Hamidian,H. Howie Huang
発行日 2024-03-27 15:11:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク