ClusterSC: Advancing Synthetic Control with Donor Selection

要約

観察研究との因果的推論では、合成制御(SC)が顕著なツールとして浮上しています。
SCは従来、集約レベルのデータセットに適用されてきましたが、最近の研究により、その使用が個人レベルのデータに拡大されています。
観測されたユニットの数が多く含まれているため、このシフトはSCに次元の呪いを導入します。
これに対処するために、行動が内部的に整列しているがグループ間で異なる場合に個人のグループが存在する可能性があるという考えに基づいて、クラスター合成制御(ClusterSC)を提案します。
ClusterSCには、ターゲットに関連するドナーのみを選択するためのクラスタリングステップが組み込まれています。
合成および実世界のデータセットに関する経験的デモンストレーションによってサポートされているClusterSCによって引き起こされる改善に関する理論的保証を提供します。
結果は、ClusterSCが一貫して古典的なSCアプローチを上回ることを示しています。

要約(オリジナル)

In causal inference with observational studies, synthetic control (SC) has emerged as a prominent tool. SC has traditionally been applied to aggregate-level datasets, but more recent work has extended its use to individual-level data. As they contain a greater number of observed units, this shift introduces the curse of dimensionality to SC. To address this, we propose Cluster Synthetic Control (ClusterSC), based on the idea that groups of individuals may exist where behavior aligns internally but diverges between groups. ClusterSC incorporates a clustering step to select only the relevant donors for the target. We provide theoretical guarantees on the improvements induced by ClusterSC, supported by empirical demonstrations on synthetic and real-world datasets. The results indicate that ClusterSC consistently outperforms classical SC approaches.

arxiv情報

著者 Saeyoung Rho,Andrew Tang,Noah Bergam,Rachel Cummings,Vishal Misra
発行日 2025-03-27 15:50:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク