Examining Pathological Bias in a Generative Adversarial Network Discriminator: A Case Study on a StyleGAN3 Model

要約

敵対的生成ネットワーク (GAN) は、人間が実際の顔と区別できないことが多いフォトリアリスティックな顔を生成します。
機械学習モデルのバイアスは、トレーニング データのバイアスが原因であると想定されることがよくありますが、事前トレーニング済みの StyleGAN3-r モデルの識別子には、トレーニング データでは説明できない病的な内部色と輝度のバイアスが見つかりました。
また、ディスクリミネーターが画像レベルと顔レベルの両方の品質によってスコアを体系的に層別化しており、これが性別、人種、その他のカテゴリ全体の画像に不均衡な影響を与えていることもわかりました。
社会心理学における固定観念の研究に共通する軸を考察します。

要約(オリジナル)

Generative adversarial networks (GANs) generate photorealistic faces that are often indistinguishable by humans from real faces. While biases in machine learning models are often assumed to be due to biases in training data, we find pathological internal color and luminance biases in the discriminator of a pre-trained StyleGAN3-r model that are not explicable by the training data. We also find that the discriminator systematically stratifies scores by both image- and face-level qualities and that this disproportionately affects images across gender, race, and other categories. We examine axes common in research on stereotyping in social psychology.

arxiv情報

著者 Alvin Grissom II,Ryan F. Lei,Matt Gusdorff,Jeova Farias Sales Rocha Neto,Bailey Lin,Ryan Trotter
発行日 2024-03-12 13:36:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG パーマリンク