Bias and Diversity in Synthetic-based Face Recognition

要約

合成データは、本物の顔データを扱う際の倫理的および法的課題を解決するために、本物のデータの代替として登場しつつあります。
現在のモデルは、存在しない人物の本物のような顔画像を作成できます。
しかし、顔認識システムはバイアス、つまり、異なる人口統計的属性と非人口統計的属性間のパフォーマンスの違いの影響を受けやすく、不公平な決定につながる可能性があることは、既知のデリケートな問題です。
この研究では、合成顔認識データセットの多様性が本物のデータセットとどのように比較されるか、また生成モデルのトレーニング データの分布が合成データの分布にどのような影響を与えるかを調査します。
これを行うために、性別、民族、年齢、頭の位置の分布を調べました。
さらに、本物のデータに基づいてトレーニングされたベースライン モデルと比較して、研究された属性に関する 3 つの最近の合成ベースの顔認識モデルの具体的なバイアスを調査しました。
私たちの結果は、ジェネレーターがさまざまな属性に関して、使用されたトレーニング データと同様の分布を生成することを示しています。
バイアスに関しては、合成ベースのモデルは本物ベースのモデルと同様のバイアス動作を共有していることがわかります。
ただし、明らかになった低いアイデンティティ内属性の一貫性は、バイアスを減らすのに有益であると思われます。

要約(オリジナル)

Synthetic data is emerging as a substitute for authentic data to solve ethical and legal challenges in handling authentic face data. The current models can create real-looking face images of people who do not exist. However, it is a known and sensitive problem that face recognition systems are susceptible to bias, i.e. performance differences between different demographic and non-demographics attributes, which can lead to unfair decisions. In this work, we investigate how the diversity of synthetic face recognition datasets compares to authentic datasets, and how the distribution of the training data of the generative models affects the distribution of the synthetic data. To do this, we looked at the distribution of gender, ethnicity, age, and head position. Furthermore, we investigated the concrete bias of three recent synthetic-based face recognition models on the studied attributes in comparison to a baseline model trained on authentic data. Our results show that the generator generate a similar distribution as the used training data in terms of the different attributes. With regard to bias, it can be seen that the synthetic-based models share a similar bias behavior with the authentic-based models. However, with the uncovered lower intra-identity attribute consistency seems to be beneficial in reducing bias.

arxiv情報

著者 Marco Huber,Anh Thi Luu,Fadi Boutros,Arjan Kuijper,Naser Damer
発行日 2023-11-07 13:12:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク