Sequential Underspecified Instrument Selection for Cause-Effect Estimation

要約

操作変数 (IV) 法は、治療変数を直接実験することができない、観察されていない交絡がある設定での因果効果を推定するために使用されます。
手段は、治療変数を介して間接的にのみ結果に影響を与える変数です。
ほとんどの IV アプリケーションは低次元の治療に焦点を当てており、少なくとも治療と同じ数の器具が非常に必要です。
この仮定は限定的です。自然科学では、高次元の治療の因果関係 (遺伝子発現や微生物叢が健康や病気に及ぼす影響など) を推論しようとすることがよくありますが、限られた数の機器を使用して少数の実験しか実行できません (
例: 薬や抗生物質)。
このような不明確な問題では、たとえ線形の場合であっても、1 回の実験では完全な治療効果を特定することはできません。
我々は、計測された部分空間への治療効果の投影を依然として確実に復元できることを示し、異なる計測セットからのそのような部分的な推定値を一貫して組み合わせる技術を開発することができる。
次に、組み合わせた推定量をアルゴリズムで活用し、実験の各ラウンドで最も有益な手段を繰り返し提案し、完全な因果効果に関する全体的な情報を最大化します。

要約(オリジナル)

Instrumental variable (IV) methods are used to estimate causal effects in settings with unobserved confounding, where we cannot directly experiment on the treatment variable. Instruments are variables which only affect the outcome indirectly via the treatment variable(s). Most IV applications focus on low-dimensional treatments and crucially require at least as many instruments as treatments. This assumption is restrictive: in the natural sciences we often seek to infer causal effects of high-dimensional treatments (e.g., the effect of gene expressions or microbiota on health and disease), but can only run few experiments with a limited number of instruments (e.g., drugs or antibiotics). In such underspecified problems, the full treatment effect is not identifiable in a single experiment even in the linear case. We show that one can still reliably recover the projection of the treatment effect onto the instrumented subspace and develop techniques to consistently combine such partial estimates from different sets of instruments. We then leverage our combined estimators in an algorithm that iteratively proposes the most informative instruments at each round of experimentation to maximize the overall information about the full causal effect.

arxiv情報

著者 Elisabeth Ailer,Jason Hartford,Niki Kilbertus
発行日 2023-05-25 17:57:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク