Debiasing Machine Learning Models by Using Weakly Supervised Learning

要約

私たちは、アルゴリズムの出力と敏感な変数の両方が連続的​​である設定で、アルゴリズムによる決定のバイアスを軽減する問題に取り組みます。
これまでの研究のほとんどは、離散的な感受性変数を扱っていました。つまり、ラベルによって定義された人のサブグループに対してバイアスが測定され、感受性変数が連続である重要なアルゴリズムによるバイアスのケースが除外されました。
典型的な例は、年齢や経済状況に関する不当な決定です。
私たちの研究では、計量経済学の分野から来た内生性の概念に基づいて、連続的な敏感な変数に対するバイアス緩和戦略を提案します。
この新しい問題を解決することに加えて、私たちのバイアス緩和戦略は、データのごく一部を公平な方法で測定できることを必要とする弱教師学習方法です。
これは、予測モデルに関して仮説を立てないという意味で、モデルに依存しません。
また、かなり大量の入力観測値とそれに対応する予測も利用します。
真の出力予測のほんの一部だけが知られている必要があります。
したがって、これにより専門家の介入の必要性が制限されます。
合成データから得られた結果は、計量経済学における実際のアプリケーションに可能な限り近い例に対する私たちのアプローチの有効性を示しています。

要約(オリジナル)

We tackle the problem of bias mitigation of algorithmic decisions in a setting where both the output of the algorithm and the sensitive variable are continuous. Most of prior work deals with discrete sensitive variables, meaning that the biases are measured for subgroups of persons defined by a label, leaving out important algorithmic bias cases, where the sensitive variable is continuous. Typical examples are unfair decisions made with respect to the age or the financial status. In our work, we then propose a bias mitigation strategy for continuous sensitive variables, based on the notion of endogeneity which comes from the field of econometrics. In addition to solve this new problem, our bias mitigation strategy is a weakly supervised learning method which requires that a small portion of the data can be measured in a fair manner. It is model agnostic, in the sense that it does not make any hypothesis on the prediction model. It also makes use of a reasonably large amount of input observations and their corresponding predictions. Only a small fraction of the true output predictions should be known. This therefore limits the need for expert interventions. Results obtained on synthetic data show the effectiveness of our approach for examples as close as possible to real-life applications in econometrics.

arxiv情報

著者 Renan D. B. Brotto,Jean-Michel Loubes,Laurent Risser,Jean-Pierre Florens,Kenji Nose-Filho,João M. T. Romano
発行日 2024-02-23 18:11:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T05, cs.CY, cs.LG パーマリンク