Synthetic Data for the Mitigation of Demographic Biases in Face Recognition

要約

本研究では、顔認識技術に影響を与える人口統計学的バイアスを、合成データの利用によって緩和する可能性を調査する。人口統計学的バイアスは、特定の人口統計学的グループに属する個人に影響を与える可能性があり、人口統計学的グループ間で顔認識システムの性能が異なることを観察することで特定することができる。これは主に、学習データにおける人口統計学的グループの表現が不均等であることから生じる。最近では、顔認識システムに影響を与えるいくつかの問題の解決策として、合成データが登場している。特に、合成データセットの人口統計学的分布を制御し、異なる人口統計学的グループを公平に表現するために、生成プロセスにおいて、画像の望ましい人口統計学的属性と顔属性を指定することが可能である。我々は、人口統計学的な偏りを持つ既存の顔認識システムを合成データで微調整することを提案する。我々はGANDiffFaceを用いて生成された合成データセットを用いる。GANDiffFaceは、制御可能な人口統計学的分布と現実的なクラス内変動を持つ顔認識用データセットを合成できる新しいフレームワークである。我々は、訓練と評価のために、異なる人口統計グループを表す複数のデータセットを考慮する。また、異なる顔認識システムを微調整し、その人口統計学的公平性を異なるメトリクスで評価する。我々の結果は、顔認識における人口統計学的バイアスを緩和するための提案アプローチと合成データの使用を支持する。

要約(オリジナル)

This study investigates the possibility of mitigating the demographic biases that affect face recognition technologies through the use of synthetic data. Demographic biases have the potential to impact individuals from specific demographic groups, and can be identified by observing disparate performance of face recognition systems across demographic groups. They primarily arise from the unequal representations of demographic groups in the training data. In recent times, synthetic data have emerged as a solution to some problems that affect face recognition systems. In particular, during the generation process it is possible to specify the desired demographic and facial attributes of images, in order to control the demographic distribution of the synthesized dataset, and fairly represent the different demographic groups. We propose to fine-tune with synthetic data existing face recognition systems that present some demographic biases. We use synthetic datasets generated with GANDiffFace, a novel framework able to synthesize datasets for face recognition with controllable demographic distribution and realistic intra-class variations. We consider multiple datasets representing different demographic groups for training and evaluation. Also, we fine-tune different face recognition systems, and evaluate their demographic fairness with different metrics. Our results support the proposed approach and the use of synthetic data to mitigate demographic biases in face recognition.

arxiv情報

著者 Pietro Melzi,Christian Rathgeb,Ruben Tolosana,Ruben Vera-Rodriguez,Aythami Morales,Dominik Lawatsch,Florian Domin,Maxim Schaubert
発行日 2024-02-02 14:57:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク