GenRec: A Flexible Data Generator for Recommendations

要約

現実的なデータセットが不足しているため、レコメンダー システムやソーシャル ネットワークの分析手法と技術のベンチマークにおいて大きな課題が生じています。
一般的で効果的な解決策は、現実的なインタラクションをシミュレートする合成データを生成することです。
しかし、さまざまな方法が提案されていますが、既存の文献には、完全に適応可能で、基礎となるデータ分布と構造特性を簡単に操作できるジェネレーターがまだ不足しています。
この問題に対処するために、本研究では、推奨シナリオで観察される現実的でよく知られた特性を示す合成ユーザーアイテムインタラクションを生成するための新しいフレームワークである GenRec を導入します。
このフレームワークは、潜在因子モデリングに基づく確率的生成プロセスに基づいています。
ここで、潜在的な要因を利用して、ロングテールの嗜好分布を得ることができ、同時にユーザーの部分母集団とトピックベースのアイテム クラスターを特徴付けることができます。
特に、提案されたフレームワークは柔軟性が高く、ユーザーとアイテムのインタラクションの生成をカスタマイズするための幅広いハイパーパラメーターを提供します。
実験の実行に使用されたコードは、https://anonymous.4open.science/r/GenRec-DED3 で公開されています。

要約(オリジナル)

The scarcity of realistic datasets poses a significant challenge in benchmarking recommender systems and social network analysis methods and techniques. A common and effective solution is to generate synthetic data that simulates realistic interactions. However, although various methods have been proposed, the existing literature still lacks generators that are fully adaptable and allow easy manipulation of the underlying data distributions and structural properties. To address this issue, the present work introduces GenRec, a novel framework for generating synthetic user-item interactions that exhibit realistic and well-known properties observed in recommendation scenarios. The framework is based on a stochastic generative process based on latent factor modeling. Here, the latent factors can be exploited to yield long-tailed preference distributions, and at the same time they characterize subpopulations of users and topic-based item clusters. Notably, the proposed framework is highly flexible and offers a wide range of hyper-parameters for customizing the generation of user-item interactions. The code used to perform the experiments is publicly available at https://anonymous.4open.science/r/GenRec-DED3.

arxiv情報

著者 Erica Coppolillo,Simone Mungari,Ettore Ritacco,Giuseppe Manco
発行日 2024-07-23 15:53:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR, cs.SI パーマリンク