Arbitrariness and Social Prediction: The Confounding Role of Variance in Fair Classification

要約

異なる訓練されたモデル間の予測値のばらつきは、公正な二値分類における誤差の重要な原因であるが、十分に調査されていない。実際には、いくつかのデータ例における分散は非常に大きく、決定は事実上恣意的になり得る。この問題を調査するために、我々は実験的アプローチを取り、4つの包括的な貢献を行う:我々は以下の4つの包括的な貢献をする:1) 恣意性を測定し削減するための代理として使用する、分散から派生した自己一貫性と呼ばれるメトリックの定義、2) 予測が恣意的である場合に分類を回避するアンサンブル・アルゴリズムの開発、3) 公正な二値分類における分散(自己一貫性と恣意性に対して)の役割に関する、これまでで最大の実証的研究の実施、4) 米国住宅ローン開示法(HMDA)データセットを将来の研究に容易に使用できるようにするツールキットのリリース。全体として、我々の実験は、ベンチマークデータセットの結論の信頼性について衝撃的な洞察を明らかにした。公正な二値分類ベンチマークのほとんどは、予測に存在する恣意性の量を考慮すると、公正に近い。この発見は、一般的なアルゴリズムの公平性手法の実用性に疑問を投げかけるものであり、ひいてはバイナリ分類における公平性の測定方法を再考すべきことを示唆するものである。

要約(オリジナル)

Variance in predictions across different trained models is a significant, under-explored source of error in fair binary classification. In practice, the variance on some data examples is so large that decisions can be effectively arbitrary. To investigate this problem, we take an experimental approach and make four overarching contributions: We: 1) Define a metric called self-consistency, derived from variance, which we use as a proxy for measuring and reducing arbitrariness; 2) Develop an ensembling algorithm that abstains from classification when a prediction would be arbitrary; 3) Conduct the largest to-date empirical study of the role of variance (vis-a-vis self-consistency and arbitrariness) in fair binary classification; and, 4) Release a toolkit that makes the US Home Mortgage Disclosure Act (HMDA) datasets easily usable for future research. Altogether, our experiments reveal shocking insights about the reliability of conclusions on benchmark datasets. Most fair binary classification benchmarks are close-to-fair when taking into account the amount of arbitrariness present in predictions — before we even try to apply any fairness interventions. This finding calls into question the practical utility of common algorithmic fairness methods, and in turn suggests that we should reconsider how we choose to measure fairness in binary classification.

arxiv情報

著者 A. Feder Cooper,Katherine Lee,Madiha Zahrah Choksi,Solon Barocas,Christopher De Sa,James Grimmelmann,Jon Kleinberg,Siddhartha Sen,Baobao Zhang
発行日 2024-03-02 22:48:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CY, cs.LG, stat.ML パーマリンク