Non-autoregressive Generative Models for Reranking Recommendation

要約

現代のレコメンデーション システムは、ユーザーの特定の要求や興味に合わせたアイテムのリストを提供することで、ユーザーのニーズを満たすように設計されています。
多段階レコメンデーション システムでは、項目間のリスト内相関をモデル化することにより、再ランキングが重要な役割を果たします。
再ランキングの主な課題は、順列の組み合わせ空間内で最適なシーケンスを探索することにあります。
最近の研究では、ジェネレーターと評価者の学習パラダイムが提案されています。このパラダイムでは、ジェネレーターが複数の実行可能なシーケンスを生成し、評価者が推定されたリストごとのスコアに基づいて最適なシーケンスを選択します。
ジェネレーターは非常に重要であり、生成モデルはジェネレーター機能に適しています。
現在の生成モデルは、シーケンス生成に自己回帰戦略を採用しています。
ただし、自己回帰モデルをリアルタイム産業システムに導入するのは困難です。
これらの問題に対処するために、効率と有効性を高めるために設計された推奨事項を再ランク付けするための非自動回帰生成モデル (NAR4Rec) を提案します。
まばらなトレーニング サンプルや動的候補などの課題に取り組むために、マッチング モデルを導入します。
ユーザーフィードバックの多様な性質を考慮して、シーケンスレベルの尤度トレーニング目標を採用して、実行可能なシーケンスと実行不可能なシーケンスを区別します。
さらに、ターゲット項目に関する非自己回帰モデルの依存関係モデリングの欠如を克服するために、これらの項目間の相関関係を捕捉するための対照的デコーディングを導入します。
広範なオフライン実験により、最先端の再ランキング手法よりも NAR4Rec の優れたパフォーマンスが検証されました。
オンライン A/B テストにより、NAR4Rec がユーザー エクスペリエンスを大幅に向上させることがわかりました。
さらに、NAR4Rec は、毎日 3 億人を超えるアクティブ ユーザーを抱える人気のビデオ アプリ Kuaishou に完全に導入されています。

要約(オリジナル)

Contemporary recommendation systems are designed to meet users’ needs by delivering tailored lists of items that align with their specific demands or interests. In a multi-stage recommendation system, reranking plays a crucial role by modeling the intra-list correlations among items. The key challenge of reranking lies in the exploration of optimal sequences within the combinatorial space of permutations. Recent research proposes a generator-evaluator learning paradigm, where the generator generates multiple feasible sequences and the evaluator picks out the best sequence based on the estimated listwise score. The generator is of vital importance, and generative models are well-suited for the generator function. Current generative models employ an autoregressive strategy for sequence generation. However, deploying autoregressive models in real-time industrial systems is challenging. To address these issues, we propose a Non-AutoRegressive generative model for reranking Recommendation (NAR4Rec) designed to enhance efficiency and effectiveness. To tackle challenges such as sparse training samples and dynamic candidates, we introduce a matching model. Considering the diverse nature of user feedback, we employ a sequence-level unlikelihood training objective to differentiate feasible sequences from unfeasible ones. Additionally, to overcome the lack of dependency modeling in non-autoregressive models regarding target items, we introduce contrastive decoding to capture correlations among these items. Extensive offline experiments validate the superior performance of NAR4Rec over state-of-the-art reranking methods. Online A/B tests reveal that NAR4Rec significantly enhances the user experience. Furthermore, NAR4Rec has been fully deployed in a popular video app Kuaishou with over 300 million daily active users.

arxiv情報

著者 Yuxin Ren,Qiya Yang,Yichun Wu,Wei Xu,Yalong Wang,Zhiqiang Zhang
発行日 2024-05-20 12:57:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク