Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction


ユーザーとアイテム間の一連の履歴インタラクションを分析することで、逐次レコメンデーション モデルはユーザーの意図を学習し、次に関心のあるアイテムを予測します。
これらのアイテムのインタラクションに加えて、ほとんどのシステムでは、ナビゲーション ページ、アカウント ページ、特定のカテゴリのページなど、特定のアイテムに関連しないページとのインタラクションもあり、ユーザーの興味に関する追加の洞察を提供する可能性があります。
私たちは、仮説テスト フレームワーク HypTrails を使用して、これらの非アイテム ページと関心のあるアイテムの間に実際に関係があることを示し、非アイテム ページを表現するさまざまなアプローチ (コンテンツに基づくなど) を提案することでこのギャップを埋めます。
後続のアイテムに関連性の高い非アイテム ページを含む合成データセットを作成して、モデルが一般的にこれらの相互作用から学習できることを示し、その後、2 つの現実世界のデータセットに非アイテム ページを含めることによって得られる改善を評価します。
CNN、RNN、およびトランスフォーマーベースのアーキテクチャをカバーする 8 つの一般的な逐次レコメンダー モデルを適応させて、アイテム以外のページを統合し、次のアイテムの予測にその情報を活用するこれらのモデルの機能を調査します。
項目以外のページを含めることで、調査されたすべてのモデル アーキテクチャにおいて次の項目の予測のパフォーマンスがさまざまな程度で向上します。


Analyzing the sequence of historical interactions between users and items, sequential recommendation models learn user intent and make predictions about the next item of interest. Next to these item interactions, most systems also have interactions with pages not related to specific items, for example navigation pages, account pages, and pages for a specific category, which may provide additional insights into the user’s interests. However, while there are several approaches to integrate additional information about items and users, the topic of integrating non-item pages has been less explored. We use the hypotheses testing framework HypTrails to show that there is indeed a relationship between these non-item pages and the items of interest and fill this gap by proposing various approaches of representing non-item pages (e.g, based on their content) to use them as an additional information source for the task of sequential next-item prediction. We create a synthetic dataset with non-item pages highly related to the subsequent item to show that the models are generally capable of learning from these interactions, and subsequently evaluate the improvements gained by including non-item pages in two real-world datasets. We adapt eight popular sequential recommender models, covering CNN-, RNN- and transformer-based architectures, to integrate non-item pages and investigate the capabilities of these models to leverage their information for next item prediction. We also analyze their behavior on noisy data and compare different item representation strategies. Our results show that non-item pages are a valuable source of information, but representing such a page well is the key to successfully leverage them. The inclusion of non-item pages can increase the performance for next-item prediction in all examined model architectures with a varying degree.


著者 Elisabeth Fischer,Daniel Schlör,Albin Zehe,Andreas Hotho
発行日 2024-08-28 17:12:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.IR, cs.LG パーマリンク