When Fair Classification Meets Noisy Protected Attributes

要約

アルゴリズムの公平性の運用には、いくつかの実際的な課題が伴いますが、その中でも特に重要なのは、データセット内の保護された属性の可用性または信頼性です。
現実世界の状況では、実際的および法的な障害により人口統計データの収集と使用が妨げられる可能性があり、アルゴリズムの公平性を確保することが困難になります。
初期の公平性アルゴリズムではこれらの制限が考慮されていませんでしたが、最近の提案では、保護された属性にノイズを組み込むか、保護された属性をまったく使用しないことによって、分類におけるアルゴリズムの公平性を達成することを目的としています。
私たちの知る限り、これは、予測性と公平性の 2 つの軸に沿って、属性依存アルゴリズム、ノイズ耐性アルゴリズム、および属性ブラインド アルゴリズムを比較する公平な分類アルゴリズムの最初の直接研究です。
私たちは、4 つの現実世界のデータセットと合成摂動に関するケーススタディを通じて、これらのアルゴリズムを評価しました。
私たちの研究では、保護された属性にノイズが多い場合でも、属性ブラインドおよびノイズ耐性の公正分類器は、属性依存アルゴリズムと同様のパフォーマンスを達成できる可能性があることが明らかになりました。
ただし、実際にそれらを実装するには、慎重なニュアンスが必要です。
私たちの研究は、保護された属性にノイズが多い、または部分的に利用可能なシナリオで公平な分類アルゴリズムを使用することの実際的な意味についての洞察を提供します。

要約(オリジナル)

The operationalization of algorithmic fairness comes with several practical challenges, not the least of which is the availability or reliability of protected attributes in datasets. In real-world contexts, practical and legal impediments may prevent the collection and use of demographic data, making it difficult to ensure algorithmic fairness. While initial fairness algorithms did not consider these limitations, recent proposals aim to achieve algorithmic fairness in classification by incorporating noisiness in protected attributes or not using protected attributes at all. To the best of our knowledge, this is the first head-to-head study of fair classification algorithms to compare attribute-reliant, noise-tolerant and attribute-blind algorithms along the dual axes of predictivity and fairness. We evaluated these algorithms via case studies on four real-world datasets and synthetic perturbations. Our study reveals that attribute-blind and noise-tolerant fair classifiers can potentially achieve similar level of performance as attribute-reliant algorithms, even when protected attributes are noisy. However, implementing them in practice requires careful nuance. Our study provides insights into the practical implications of using fair classification algorithms in scenarios where protected attributes are noisy or partially available.

arxiv情報

著者 Avijit Ghosh,Pablo Kvitca,Christo Wilson
発行日 2023-07-11 14:20:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG パーマリンク