要約
オンラインビデオプラットフォームでは、興味深いビデオに対するコメントを読んだり書いたりすることがビデオ視聴体験の重要な部分になっています。
しかし、既存のビデオ推奨システムは主にビデオとのユーザーのインタラクション行動をモデル化しており、ユーザー行動モデリングにおけるコメントの考慮が欠けています。
本稿では、動画とコメントの両方に対するユーザーのインタラクション履歴を活用し、パーソナライズされた動画とコメントの推薦を共同で行うLSVCRと呼ばれる新しい推薦アプローチを提案します。
具体的には、私たちのアプローチは、逐次推奨 (SR) モデルと補足大規模言語モデル (LLM) レコメンダーという 2 つの主要なコンポーネントで構成されています。
SR モデルは、当社のアプローチの主要な推奨バックボーン (展開時に保持) として機能し、効率的なユーザー設定モデリングを可能にします。
一方、異種インタラクション動作から基礎となるユーザーの好みをより適切に捕捉するために、LLM レコメンダーを補足コンポーネント (展開時に破棄される) として活用します。
SR モデルと補足的な LLM レコメンダーの利点を統合するために、2 段階のトレーニング パラダイムを設計します。
最初の段階は、パーソナライズされたプリファレンスの調整です。これは、両方のコンポーネントからのプリファレンス表現を調整し、それによって SR モデルのセマンティクスを強化することを目的としています。
第 2 段階は推奨指向の微調整であり、アライメント強化された SR モデルが特定の目的に従って微調整されます。
動画とコメントの推奨タスクの両方における広範な実験により、LSVCR の有効性が実証されました。
さらに、KuaiShou プラットフォームでのオンライン A/B テストにより、当社のアプローチによってもたらされる実際の利点が検証されます。
特に、コメント総再生時間は全体で 4.13% という大幅な増加を達成しました。
要約(オリジナル)
In online video platforms, reading or writing comments on interesting videos has become an essential part of the video watching experience. However, existing video recommender systems mainly model users’ interaction behaviors with videos, lacking consideration of comments in user behavior modeling. In this paper, we propose a novel recommendation approach called LSVCR by leveraging user interaction histories with both videos and comments, so as to jointly conduct personalized video and comment recommendation. Specifically, our approach consists of two key components, namely sequential recommendation (SR) model and supplemental large language model (LLM) recommender. The SR model serves as the primary recommendation backbone (retained in deployment) of our approach, allowing for efficient user preference modeling. Meanwhile, we leverage the LLM recommender as a supplemental component (discarded in deployment) to better capture underlying user preferences from heterogeneous interaction behaviors. In order to integrate the merits of the SR model and the supplemental LLM recommender, we design a twostage training paradigm. The first stage is personalized preference alignment, which aims to align the preference representations from both components, thereby enhancing the semantics of the SR model. The second stage is recommendation-oriented fine-tuning, in which the alignment-enhanced SR model is fine-tuned according to specific objectives. Extensive experiments in both video and comment recommendation tasks demonstrate the effectiveness of LSVCR. Additionally, online A/B testing on the KuaiShou platform verifies the actual benefits brought by our approach. In particular, we achieve a significant overall gain of 4.13% in comment watch time.
arxiv情報
著者 | Bowen Zheng,Zihan Lin,Enze Liu,Chen Yang,Enyang Bai,Cheng Ling,Wayne Xin Zhao,Ji-Rong Wen |
発行日 | 2024-03-20 13:14:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google