Causal Imputation for Counterfactual SCMs: Bridging Graphs and Latent Factor Models

要約

私たちは、因果関係の代入というタスクを検討します。このタスクでは、考えられる広範囲のコンテキストにわたる一連のアクションの結果を予測することを目的としています。
実行例として、さまざまな薬剤がさまざまな細胞型の細胞にどのような影響を与えるかを予測することを考えます。
ここでは、アクションとコンテキストが有限数の可能な値を持つカテゴリ変数であるインデックスのみの設定を検討します。
この単純な設定であっても、実際的な課題が生じます。これは、多くの場合、考えられるアクションとコンテキストのペアの小さなサブセットしか研究されていないためです。
したがって、モデルは新しいアクションとコンテキストのペアを推定する必要があります。これは、アクションによってインデックス付けされた行、コンテキストによってインデックス付けされた列、および結果に対応する行列エントリを含む行列補完の形式として構成できます。
新しい SCM ベースのモデル クラスを導入します。このモデル クラスでは、結果は反事実として表現され、アクションは操作変数の介入として表現され、コンテキストはシステムの初期状態に基づいて定義されます。
線形性の仮定の下で、この設定により、追加の固定効果項を伴う、結果の行列に対する潜在因子モデルが誘導されることを示します。
このモデルクラスに基づいて因果予測を実行するために、合成介入推定器への単純な拡張を導入します (Agarwal et al., 2020)。
我々は、PRISM薬物再利用データセットでいくつかのマトリックス補完アプローチを評価し、私たちの方法が他の考慮されたすべてのマトリックス補完アプローチよりも優れていることを示しています。

要約(オリジナル)

We consider the task of causal imputation, where we aim to predict the outcomes of some set of actions across a wide range of possible contexts. As a running example, we consider predicting how different drugs affect cells from different cell types. We study the index-only setting, where the actions and contexts are categorical variables with a finite number of possible values. Even in this simple setting, a practical challenge arises, since often only a small subset of possible action-context pairs have been studied. Thus, models must extrapolate to novel action-context pairs, which can be framed as a form of matrix completion with rows indexed by actions, columns indexed by contexts, and matrix entries corresponding to outcomes. We introduce a novel SCM-based model class, where the outcome is expressed as a counterfactual, actions are expressed as interventions on an instrumental variable, and contexts are defined based on the initial state of the system. We show that, under a linearity assumption, this setup induces a latent factor model over the matrix of outcomes, with an additional fixed effect term. To perform causal prediction based on this model class, we introduce simple extension to the Synthetic Interventions estimator (Agarwal et al., 2020). We evaluate several matrix completion approaches on the PRISM drug repurposing dataset, showing that our method outperforms all other considered matrix completion approaches.

arxiv情報

著者 Alvaro Ribot,Chandler Squires,Caroline Uhler
発行日 2024-02-22 18:37:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク