Common Functional Decompositions Can Mis-attribute Differences in Outcomes Between Populations

要約

科学と社会科学では、2つの集団で結果が異なる理由をよく説明したいと考えています。
たとえば、雇用プログラムがある都市のメンバーが別の都市よりもメンバーに利益をもたらす場合、プログラム参加者(特定の共変量)または地元の労働市場(共変量を与えられた結果)の違いにより?
Kitagawa-Oaxaca-Blinder(KOB)分解は、2つの集団の平均結果の違いを説明する計量経済学の標準ツールです。
ただし、KOB分解は共変量と結果の間の線形関係を想定していますが、真の関係は有意義に非線形である可能性があります。
現代の機械学習は、1つの集団の結果と共変量の関係について、さまざまな非線形機能分解を誇っています。
これらの機能的分解を使用してKOB分解を拡張することは自然なようです。
成功した拡張は、2つの集団で同じである場合、共変量、またはそれぞれ共変量を与えられた結果を与えられた結果に帰属させるべきではないことを観察します。
残念ながら、単純な例であっても、2つの一般的な分解と局所効果を蓄積した2つの一般的な分解 – は、2つの集団で同一であっても、共変量を与えられた結果に違いを帰する可能性があることを実証します。
機能的なANOVAの誤った誤ったものの特性と、誤った分布を避けるために個別の分解が満たさなければならない一般的な特性の特性を提供します。
分解が入力分布とは無関係である場合、誤って出さないことを示します。
さらに、共変量の分布に依存する合理的な添加剤分解で誤った違いが生じると推測します。

要約(オリジナル)

In science and social science, we often wish to explain why an outcome is different in two populations. For instance, if a jobs program benefits members of one city more than another, is that due to differences in program participants (particular covariates) or the local labor markets (outcomes given covariates)? The Kitagawa-Oaxaca-Blinder (KOB) decomposition is a standard tool in econometrics that explains the difference in the mean outcome across two populations. However, the KOB decomposition assumes a linear relationship between covariates and outcomes, while the true relationship may be meaningfully nonlinear. Modern machine learning boasts a variety of nonlinear functional decompositions for the relationship between outcomes and covariates in one population. It seems natural to extend the KOB decomposition using these functional decompositions. We observe that a successful extension should not attribute the differences to covariates — or, respectively, to outcomes given covariates — if those are the same in the two populations. Unfortunately, we demonstrate that, even in simple examples, two common decompositions — functional ANOVA and Accumulated Local Effects — can attribute differences to outcomes given covariates, even when they are identical in two populations. We provide a characterization of when functional ANOVA misattributes, as well as a general property that any discrete decomposition must satisfy to avoid misattribution. We show that if the decomposition is independent of its input distribution, it does not misattribute. We further conjecture that misattribution arises in any reasonable additive decomposition that depends on the distribution of the covariates.

arxiv情報

著者 Manuel Quintero,William T. Stephenson,Advik Shreekumar,Tamara Broderick
発行日 2025-04-23 16:36:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, stat.ME, stat.ML パーマリンク