AI-Face: A Million-Scale Demographically Annotated AI-Generated Face Dataset and Fairness Benchmark


したがって、AI によって生成された顔を検出することが重要になりますが、現在の検出器は、異なる人口統計グループ間で偏ったパフォーマンスを示します。
しかし、人口統計的属性と多様な生成方法の両方を包括的に網羅する既存のデータセットは存在しないため、AI によって生成された顔の公平な検出器の開発が妨げられています。
この研究では、AI-Face データセットを紹介します。これは、本物の顔、ディープフェイク ビデオの顔、敵対的生成ネットワークと拡散モデルによって生成された顔など、人口統計学的に注釈が付けられた初の 100 万規模の AI 生成顔画像データセットです。
このデータセットに基づいて、さまざまな AI 顔検出器を評価するための最初の包括的な公平性ベンチマークを実施し、AI 顔検出器の将来の公平な設計を促進するための貴重な洞察と調査結果を提供します。
AI-Face データセットとベンチマーク コードは、 で公開されています。


AI-generated faces have enriched human life, such as entertainment, education, and art. However, they also pose misuse risks. Therefore, detecting AI-generated faces becomes crucial, yet current detectors show biased performance across different demographic groups. Mitigating biases can be done by designing algorithmic fairness methods, which usually require demographically annotated face datasets for model training. However, no existing dataset comprehensively encompasses both demographic attributes and diverse generative methods, which hinders the development of fair detectors for AI-generated faces. In this work, we introduce the AI-Face dataset, the first million-scale demographically annotated AI-generated face image dataset, including real faces, faces from deepfake videos, and faces generated by Generative Adversarial Networks and Diffusion Models. Based on this dataset, we conduct the first comprehensive fairness benchmark to assess various AI face detectors and provide valuable insights and findings to promote the future fair design of AI face detectors. Our AI-Face dataset and benchmark code are publicly available at


著者 Li Lin,Santosh,Xin Wang,Shu Hu
発行日 2024-06-04 16:08:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク