Image-based Treatment Effect Heterogeneity

要約

ランダム化比較試験(RCT)は、介入の平均治療効果(ATE)を推定するためのゴールドスタンダードとみなされます。
RCT の用途の 1 つは、世界的貧困の原因を研究することです。このテーマは、「世界的貧困を軽減するための実験的アプローチ」に対して、デュフロ、バナジー、クレマーに授与された 2019 年のノーベル記念賞で明示的に引用されています。
ATE は母集団の概要であるため、反貧困実験では、RCT データ収集中に測定された年齢や民族などの表形式の変数を条件付け (CATE) することで、ATE 周辺の効果の変動を解明しようとすることがよくあります。
このような変数は CATE を解明する鍵となりますが、表形式の RCT データは多くの場合、実験の近くでしか観察されないため、そのような変数のみを使用すると、変動に影響を与える歴史的、地理的、または近隣固有の寄与因子を捕捉できない可能性があります。
世界的な貧困研究において、実験施設の位置がほぼわかっている場合、衛星画像は異質性を理解するために重要な要素を知るための窓を提供することができます。
しかし、応用研究者が画像から CATE を分析できるようにする具体的な方法はありません。
この論文では、深層確率モデリングフレームワークを使用して、類似した治療効果分布を持つ画像を識別することによって画像の潜在クラスターを推定するような方法を開発します。
当社の解釈可能な画像 CATE モデルには、効果クラスター予測に寄与する画像セグメントの重要性を定量化する感度係数も含まれています。
提案された方法をシミュレーションで代替案と比較します。
また、実際の RCT でモデルがどのように機能するかを示し、ウガンダ北部における貧困対策介入の効果を推定し、実験データが収集されていない国の残りの地域の効果に対する事後予測分布を取得します。
すべてのモデルをオープンソース ソフトウェアで利用できるようにします。

要約(オリジナル)

Randomized controlled trials (RCTs) are considered the gold standard for estimating the average treatment effect (ATE) of interventions. One use of RCTs is to study the causes of global poverty — a subject explicitly cited in the 2019 Nobel Memorial Prize awarded to Duflo, Banerjee, and Kremer ‘for their experimental approach to alleviating global poverty.’ Because the ATE is a population summary, anti-poverty experiments often seek to unpack the effect variation around the ATE by conditioning (CATE) on tabular variables such as age and ethnicity that were measured during the RCT data collection. Although such variables are key to unpacking CATE, using only such variables may fail to capture historical, geographical, or neighborhood-specific contributors to effect variation, as tabular RCT data are often only observed near the time of the experiment. In global poverty research, when the location of the experiment units is approximately known, satellite imagery can provide a window into such factors important for understanding heterogeneity. However, there is no method that specifically enables applied researchers to analyze CATE from images. In this paper, using a deep probabilistic modeling framework, we develop such a method that estimates latent clusters of images by identifying images with similar treatment effects distributions. Our interpretable image CATE model also includes a sensitivity factor that quantifies the importance of image segments contributing to the effect cluster prediction. We compare the proposed methods against alternatives in simulation; also, we show how the model works in an actual RCT, estimating the effects of an anti-poverty intervention in northern Uganda and obtaining a posterior predictive distribution over effects for the rest of the country where no experimental data was collected. We make all models available in open-source software.

arxiv情報

著者 Connor T. Jerzak,Fredrik Johansson,Adel Daoud
発行日 2023-05-25 16:42:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62D20, cs.LG, I.2.0, stat.ME パーマリンク