FAL-CUR: Fair Active Learning using Uncertainty and Representativeness on Fair Clustering


アクティブ ラーニング (AL) 技術は、さまざまな機械学習タスクにわたってデータのラベル付けコストを削減するのに非常に効果的であることが証明されています。
それにもかかわらず、これらの方法の既知の課題の 1 つは、機密性の高い属性に対して不公平をもたらす可能性があることです。
最近のアプローチは AL の公平性を高めることに焦点を当てていますが、モデルの精度が低下する傾向があります。
この問題に対処するために、AL の公平性を向上させるために、公平なクラスタリング、不確実性、および代表性 (FAL-CUR) を使用した公平なアクティブ ラーニングと呼ばれる新しい戦略を提案します。
FAL-CUR は、不確実性と代表性のスコアに基づいてどのサンプルをクエリするかを決定する取得関数と公平なクラスタリングを組み合わせることで、AL の公平性の問題に取り組みます。
私たちは 4 つの現実世界のデータセットで FAL-CUR のパフォーマンスを評価しました。その結果、FAL-CUR は均等化されたオッズの観点から、最先端の最良の方法と比較して公平性が 15% ~ 20% 向上していることが実証されました。
さらに、アブレーション研究では、公平性の維持におけるフェア クラスタリングの重要な役割と、精度パフォーマンスの安定化における取得機能が強調されています。


Active Learning (AL) techniques have proven to be highly effective in reducing data labeling costs across a range of machine learning tasks. Nevertheless, one known challenge of these methods is their potential to introduce unfairness towards sensitive attributes. Although recent approaches have focused on enhancing fairness in AL, they tend to reduce the model’s accuracy. To address this issue, we propose a novel strategy, named Fair Active Learning using fair Clustering, Uncertainty, and Representativeness (FAL-CUR), to improve fairness in AL. FAL-CUR tackles the fairness problem in AL by combining fair clustering with an acquisition function that determines which samples to query based on their uncertainty and representativeness scores. We evaluate the performance of FAL-CUR on four real-world datasets, and the results demonstrate that FAL-CUR achieves a 15% – 20% improvement in fairness compared to the best state-of-the-art method in terms of equalized odds while maintaining stable accuracy scores. Furthermore, an ablation study highlights the crucial roles of fair clustering in preserving fairness and the acquisition function in stabilizing the accuracy performance.


著者 Ricky Fajri,Akrati Saxena,Yulong Pei,Mykola Pechenizkiy
発行日 2023-12-19 16:17:04+00:00
arxivサイト arxiv_id(pdf)

