Toward Fairer Face Recognition Datasets

要約

顔認識と検証は、ディープ表現の導入によりパフォーマンスが向上した 2 つのコンピューター ビジョン タスクです。
しかし、顔データの機密性と実際のトレーニング データセットのバイアスによる倫理的、法的、技術的な課題がその開発を妨げています。
生成 AI は架空のアイデンティティを作成することでプライバシーに対処しますが、公平性の問題は依然として残ります。
生成されたトレーニング データセットに人口統計的属性のバランスをとるメカニズムを導入することで、公平性を促進します。
既存の実際のデータセット、生成された 3 つのトレーニング データセット、および拡散ベースのデータセットのバランスの取れたバージョンを実験します。
私たちは、正確さと公平性を同等に考慮し、属性の厳密な回帰ベースの統計分析を含む包括的な評価を提案します。
分析の結果、バランスをとることで人口統計上の不公平が軽減されることがわかりました。
また、時間の経過とともに生成の精度が向上しているにもかかわらず、パフォーマンスのギャップは残ります。
提案されたバランシング手法と包括的な検証評価により、より公平かつ透明な顔認識と検証が促進されます。

要約(オリジナル)

Face recognition and verification are two computer vision tasks whose performance has progressed with the introduction of deep representations. However, ethical, legal, and technical challenges due to the sensitive character of face data and biases in real training datasets hinder their development. Generative AI addresses privacy by creating fictitious identities, but fairness problems persist. We promote fairness by introducing a demographic attributes balancing mechanism in generated training datasets. We experiment with an existing real dataset, three generated training datasets, and the balanced versions of a diffusion-based dataset. We propose a comprehensive evaluation that considers accuracy and fairness equally and includes a rigorous regression-based statistical analysis of attributes. The analysis shows that balancing reduces demographic unfairness. Also, a performance gap persists despite generation becoming more accurate with time. The proposed balancing method and comprehensive verification evaluation promote fairer and transparent face recognition and verification.

arxiv情報

著者 Alexandre Fournier-Mongieux,Michael Soumm,Adrian Popescu,Bertrand Luvison,Hervé Le Borgne
発行日 2024-06-24 12:33:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク