Local Causal Discovery for Structural Evidence of Direct Discrimination

要約

不公平の原因経路を特定することは、政策設計とアルゴリズムによる意思決定を改善する上で重要な目的です。
因果的公平性分析におけるこれまでの研究では、多くの場合、因果グラフの知識が必要とされ、複雑な領域や知識の少ない領域での実用的な応用が妨げられていました。
さらに、データから因果構造を学習するグローバル発見手法は、有限サンプルではパフォーマンスが不安定になる可能性があり、矛盾した公平性の結論につながる可能性があります。
これらの問題を軽減するために、直接差別の局所発見 (LD3) を導入します。これは、結果変数の原因となる親を特定することによって、直接差別の構造的証拠を明らかにする方法です。
LD3 は、変数セットのサイズに対して線形数の条件付き独立性検定を実行し、結果の親が潜在的でないという十分な条件下で潜在的交絡を考慮します。
LD3 が、直接識別の定性的指標である重み付けされた制御された直接効果の新しいグラフィック基準の下で有効な調整セット (VAS) を返すことを示します。
LD3 は不必要な調整を制限し、不公平性を評価するための解釈可能な VAS を提供します。
私たちは LD3 を使用して、犯罪再犯予測と肝臓移植の割り当てという 2 つの複雑な意思決定システムにおける因果関係の公平性を分析します。
LD3 は、実行に 46 倍から 5,870 倍の時間がかかるベースラインよりも時間効率が高く、現実世界のデータに関してより妥当な結果を返しました。

要約(オリジナル)

Identifying the causal pathways of unfairness is a critical objective in improving policy design and algorithmic decision-making. Prior work in causal fairness analysis often requires knowledge of the causal graph, hindering practical applications in complex or low-knowledge domains. Moreover, global discovery methods that learn causal structure from data can result in unstable performance with finite samples, potentially leading to contradictory fairness conclusions. To mitigate these issues, we introduce local discovery for direct discrimination (LD3): a method that uncovers structural evidence of direct discrimination by identifying the causal parents of an outcome variable. LD3 performs a linear number of conditional independence tests relative to variable set size, and allows for latent confounding under the sufficient condition that no parent of the outcome is latent. We show that LD3 returns a valid adjustment set (VAS) under a new graphical criterion for the weighted controlled direct effect, a qualitative indicator of direct discrimination. LD3 limits unnecessary adjustment, providing interpretable VAS for assessing unfairness. We use LD3 to analyze causal fairness in two complex decision systems: criminal recidivism prediction and liver transplant allocation. LD3 was more time-efficient and returned more plausible results on real-world data than baselines, which took 46x to 5870x longer to execute.

arxiv情報

著者 Jacqueline Maasch,Kyra Gan,Violet Chen,Agni Orfanoudaki,Nil-Jana Akpinar,Fei Wang
発行日 2024-08-27 15:28:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク