要約
シーケンシャル レコメンデーション システムは、ユーザーのインタラクション履歴に基づいて、ユーザーにパーソナライズされたレコメンデーションを提供することを目的としています。
これを達成するために、多くの場合、アイテムのテキストによる説明やユーザーの好みや意図の予測などの補助タスクなどの補助情報が組み込まれます。
これらのモデルを強化するための多くの努力にもかかわらず、依然としてパーソナライゼーションが制限されています。
この問題に対処するために、私たちは、選好識別と呼ぶ新しいパラダイムを提案します。
好みの把握では、コンテキスト内のユーザーの好みに基づいて生成逐次推奨システムを明示的に条件付けします。
この目的を達成するために、ユーザー レビューとアイテム固有のデータに基づいて大規模言語モデル (LLM) を使用してユーザーの好みを生成します。
逐次レコメンデーション システムの好みを識別する機能を評価するために、好みのステアリングや感情追跡など、さまざまなシナリオにわたる総合的な評価を提供する新しいベンチマークを導入します。
私たちはベンチマークを使用して現在の最先端の方法を評価し、ユーザーの好みを正確に識別するのに苦労していることを示しました。
そこで、既存の手法を改良した Mender ($\textbf{M}$ultimodal Prefer$\textbf{en}$ce $\textbf{d}$iscern$\textbf{er}$) という新しい手法を提案します。
当社のベンチマークで最先端のパフォーマンスを達成します。
私たちの結果は、トレーニング中に人間の好みが観察されなかったとしても、Mender が人間の好みによって効果的に誘導され、よりパーソナライズされた逐次レコメンデーション システムへの道を開くことができることを示しています。
コードとベンチマークは公開時にオープンソース化します。
要約(オリジナル)
Sequential recommendation systems aim to provide personalized recommendations for users based on their interaction history. To achieve this, they often incorporate auxiliary information, such as textual descriptions of items and auxiliary tasks, like predicting user preferences and intent. Despite numerous efforts to enhance these models, they still suffer from limited personalization. To address this issue, we propose a new paradigm, which we term preference discerning. In preference dscerning, we explicitly condition a generative sequential recommendation system on user preferences within its context. To this end, we generate user preferences using Large Language Models (LLMs) based on user reviews and item-specific data. To evaluate preference discerning capabilities of sequential recommendation systems, we introduce a novel benchmark that provides a holistic evaluation across various scenarios, including preference steering and sentiment following. We assess current state-of-the-art methods using our benchmark and show that they struggle to accurately discern user preferences. Therefore, we propose a new method named Mender ($\textbf{M}$ultimodal Prefer$\textbf{en}$ce $\textbf{d}$iscern$\textbf{er}$), which improves upon existing methods and achieves state-of-the-art performance on our benchmark. Our results show that Mender can be effectively guided by human preferences even though they have not been observed during training, paving the way toward more personalized sequential recommendation systems. We will open-source the code and benchmarks upon publication.
arxiv情報
| 著者 | Fabian Paischer,Liu Yang,Linfeng Liu,Shuai Shao,Kaveh Hassani,Jiacheng Li,Ricky Chen,Zhang Gabriel Li,Xialo Gao,Wei Shao,Xue Feng,Nima Noorshams,Sem Park,Bo Long,Hamid Eghbalzadeh |
| 発行日 | 2024-12-11 18:26:55+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google