Review-driven Personalized Preference Reasoning with Large Language Models for Recommendation

要約

大規模な言語モデル(LLMS)の最近の進歩により、幅広いタスクにわたって並外れたパフォーマンスが実証されており、推奨システムへのアプリケーションに大きな関心を集めています。
ただし、既存の方法は、LLMの可能性を完全に活用していません。多くの場合、限られた入力情報によって制約されているか、高度な推論機能を完全に活用できなかったことがよくあります。
これらの制限に対処するために、ユーザーとアイテムのレビューに含まれる豊富な選好情報を活用するように設計された新しいLLMベースの推奨ユーザーであるExp3RTを紹介します。
EXP3RTは、基本的に教師LLMからの蒸留により微調整され、3つの重要なタスクを順番に実行します。EXP3RTは、最初の抽出および生のレビューから本質的な主観的な好みをカプセル化し、特定の基準に従ってユーザーとアイテムのプロファイルを作成するための特定の基準に従ってそれらを要約します。
次に、ユーザー/アイテムのプロファイルとアイテムの説明からの主観的および客観的な情報の両方を考慮することにより、詳細なステップバイステップの推論に続いて予測された評価、つまり推論強化評価予測が生成されます。
EXP3RTからのこのパーソナライズされた好みの推論は、評価予測の精度を高め、推奨の忠実で合理的な説明を提供します。
広範な実験では、EXP3RTは、推奨システムの説明可能性を大幅に向上させながら、評価予測と候補アイテムの再ランキングの両方で既存の方法を上回ることが示されています。

要約(オリジナル)

Recent advancements in Large Language Models (LLMs) have demonstrated exceptional performance across a wide range of tasks, generating significant interest in their application to recommendation systems. However, existing methods have not fully capitalized on the potential of LLMs, often constrained by limited input information or failing to fully utilize their advanced reasoning capabilities. To address these limitations, we introduce EXP3RT, a novel LLM-based recommender designed to leverage rich preference information contained in user and item reviews. EXP3RT is basically fine-tuned through distillation from a teacher LLM to perform three key tasks in order: EXP3RT first extracts and encapsulates essential subjective preferences from raw reviews, aggregates and summarizes them according to specific criteria to create user and item profiles. It then generates detailed step-by-step reasoning followed by predicted rating, i.e., reasoning-enhanced rating prediction, by considering both subjective and objective information from user/item profiles and item descriptions. This personalized preference reasoning from EXP3RT enhances rating prediction accuracy and also provides faithful and reasonable explanations for recommendation. Extensive experiments show that EXP3RT outperforms existing methods on both rating prediction and candidate item reranking for top-k recommendation, while significantly enhancing the explainability of recommendation systems.

arxiv情報

著者 Jieyong Kim,Hyunseo Kim,Hyunjin Cho,SeongKu Kang,Buru Chang,Jinyoung Yeo,Dongha Lee
発行日 2025-04-25 11:10:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク