要約
私たちは、多変量治療を用いた交絡線形回帰モデルにおける観察データと介入データの混合からの因果効果推定を研究します。
我々は、観察設定と介入設定の両方から生じる推定量を組み合わせることで、期待二乗誤差に関する統計的効率を改善できることを示します。
この目的を達成するために、行列重み付き線形推定量に基づいて方法を導き出し、私たちの方法が無限のサンプル制限で漸近的に不偏であることを証明します。
これは、介入データと観察データの結合を使用したプールされた推定量と比較して重要な改善です。この推定では、観察データと介入データの比率がゼロになる傾向がある場合にのみ偏りが消えます。
合成データに関する研究は、私たちの理論的発見を裏付けています。
交絡が大きく、観察データと介入データの比率が大きい設定では、当社の推定量はスタイン型推定量やその他のさまざまなベースラインよりも優れています。
要約(オリジナル)
We study causal effect estimation from a mixture of observational and interventional data in a confounded linear regression model with multivariate treatments. We show that the statistical efficiency in terms of expected squared error can be improved by combining estimators arising from both the observational and interventional setting. To this end, we derive methods based on matrix weighted linear estimators and prove that our methods are asymptotically unbiased in the infinite sample limit. This is an important improvement compared to the pooled estimator using the union of interventional and observational data, for which the bias only vanishes if the ratio of observational to interventional data tends to zero. Studies on synthetic data confirm our theoretical findings. In settings where confounding is substantial and the ratio of observational to interventional data is large, our estimators outperform a Stein-type estimator and various other baselines.
arxiv情報
著者 | Klaus-Rudolf Kladny,Julius von Kügelgen,Bernhard Schölkopf,Michael Muehlebach |
発行日 | 2023-06-09 16:16:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google