要約
従来の推奨アルゴリズムの多くは、データから相関パターンをマイニングまたは学習して、ユーザーとアイテムの相関的な嗜好を推定するという基本的な考え方に基づいて設計されています。
ただし、純粋な相関学習は予測においてシンプソンのパラドックスを引き起こす可能性があり、その結果、推奨パフォーマンスが犠牲になります。
シンプソンのパラドックスはよく知られた統計現象であり、統計的結論に混乱を引き起こし、パラドックスを無視すると不正確な決定が生じる可能性があります。
幸いなことに、因果モデリングと反事実モデリングは、そのような問題に取り組むために、ユーザーのモデリングやパーソナライゼーションについて観察データの外側で考えるのに役立ちます。
この論文では、協調フィルタリングと推奨における因果関係をモデル化するための一般的なフレームワークである因果協調フィルタリング (CCF) を提案します。
私たちは、CF の統一された因果関係のビューを提供し、従来の CF アルゴリズムの多くが、単純化された因果関係グラフの下で実際には CCF の特殊なケースであることを数学的に示します。
次に、観察データに基づいてユーザーアイテムの因果的選好を推定できるように、$do$ 操作に対する条件付き介入アプローチを提案します。
最後に、ユーザーアイテムの好みを推定するための一般的な反事実的制約付き学習フレームワークをさらに提案します。
実験は 2 種類の実世界のデータセット (従来の試験データとランダム化された試験データ) に対して行われ、結果は、私たちのフレームワークが推奨パフォーマンスを向上させ、多くの CF アルゴリズムのシンプソンのパラドックス問題を軽減できることを示しています。
要約(オリジナル)
Many of the traditional recommendation algorithms are designed based on the fundamental idea of mining or learning correlative patterns from data to estimate the user-item correlative preference. However, pure correlative learning may lead to Simpson’s paradox in predictions, and thus results in sacrificed recommendation performance. Simpson’s paradox is a well-known statistical phenomenon, which causes confusions in statistical conclusions and ignoring the paradox may result in inaccurate decisions. Fortunately, causal and counterfactual modeling can help us to think outside of the observational data for user modeling and personalization so as to tackle such issues. In this paper, we propose Causal Collaborative Filtering (CCF) — a general framework for modeling causality in collaborative filtering and recommendation. We provide a unified causal view of CF and mathematically show that many of the traditional CF algorithms are actually special cases of CCF under simplified causal graphs. We then propose a conditional intervention approach for $do$-operations so that we can estimate the user-item causal preference based on the observational data. Finally, we further propose a general counterfactual constrained learning framework for estimating the user-item preferences. Experiments are conducted on two types of real-world datasets — traditional and randomized trial data — and results show that our framework can improve the recommendation performance and reduce the Simpson’s paradox problem of many CF algorithms.
arxiv情報
著者 | Shuyuan Xu,Yingqiang Ge,Yunqi Li,Zuohui Fu,Xu Chen,Yongfeng Zhang |
発行日 | 2023-08-14 15:58:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google