Mitigating Bias Using Model-Agnostic Data Attribution

要約

機械学習モデルのバイアスを軽減することは、公平性と公平性を確保するために重要な取り組みです。
この論文では、ピクセル画像の属性を利用して、バイアス属性に関する重要な情報を含む画像の領域を特定し、正規化することで、バイアスに対処する新しいアプローチを提案します。
私たちの方法では、モデルに依存しないアプローチを利用して、小さな画像パッチでトレーニングされた畳み込みニューラル ネットワーク (CNN) 分類器を使用してピクセルの属性を抽出します。
単一のパッチのみを使用して画像全体のプロパティを予測するように分類器をトレーニングすることで、画像全体にわたる重要な情報の分布についての洞察を提供する領域ベースの属性を実現します。
私たちは、これらの属性を利用して、データに偏りをもたらす交絡的な属性を持つターゲットのノイズをデータセットに導入し、それによってニューラル ネットワークがこれらのバイアスを学習して主な属性を強調するのを抑制することを提案します。
私たちのアプローチは、大きく偏ったデータセットに対して偏りのない分類器のトレーニングを可能にする有効性を示しています。

要約(オリジナル)

Mitigating bias in machine learning models is a critical endeavor for ensuring fairness and equity. In this paper, we propose a novel approach to address bias by leveraging pixel image attributions to identify and regularize regions of images containing significant information about bias attributes. Our method utilizes a model-agnostic approach to extract pixel attributions by employing a convolutional neural network (CNN) classifier trained on small image patches. By training the classifier to predict a property of the entire image using only a single patch, we achieve region-based attributions that provide insights into the distribution of important information across the image. We propose utilizing these attributions to introduce targeted noise into datasets with confounding attributes that bias the data, thereby constraining neural networks from learning these biases and emphasizing the primary attributes. Our approach demonstrates its efficacy in enabling the training of unbiased classifiers on heavily biased datasets.

arxiv情報

著者 Sander De Coninck,Wei-Cheng Wang,Sam Leroux,Pieter Simoens
発行日 2024-05-08 13:00:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク