Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated Images


この研究は、AI によって生成された最先端のビジュアル コンテンツを区別するためのエージェントを包括的に評価することを目的としています。
私たちの研究では、新たに収集された大規模な偽画像データセット Fake2M を使用して、人間の能力と最先端の偽画像検出 AI アルゴリズムの両方をベンチマークします。
HPBench と題された人間の知覚評価では、人間は本物の写真と AI が生成した写真を区別するのに非常に苦労しており、誤分類率は 38.7% であることがわかりました。
これに伴い、AI 生成画像検出評価 MPBench のモデル機能も実施しました。MPBench の最高性能モデルは、人間による評価と同じ設定で 13% の故障率を達成しました。
私たちは、この研究が AI 生成画像の潜在的なリスクに対する認識を高め、虚偽の情報の拡散を防ぐためのさらなる研究を促進することができることを願っています。
詳細については、 を参照してください。


Photos serve as a way for humans to record what they experience in their daily lives, and they are often regarded as trustworthy sources of information. However, there is a growing concern that the advancement of artificial intelligence (AI) technology may produce fake photos, which can create confusion and diminish trust in photographs. This study aims to comprehensively evaluate agents for distinguishing state-of-the-art AI-generated visual content. Our study benchmarks both human capability and cutting-edge fake image detection AI algorithms, using a newly collected large-scale fake image dataset Fake2M. In our human perception evaluation, titled HPBench, we discovered that humans struggle significantly to distinguish real photos from AI-generated ones, with a misclassification rate of 38.7%. Along with this, we conduct the model capability of AI-Generated images detection evaluation MPBench and the top-performing model from MPBench achieves a 13% failure rate under the same setting used in the human evaluation. We hope that our study can raise awareness of the potential risks of AI-generated images and facilitate further research to prevent the spread of false information. More information can refer to


著者 Zeyu Lu,Di Huang,Lei Bai,Jingjing Qu,Chengyue Wu,Xihui Liu,Wanli Ouyang
発行日 2023-06-13 15:14:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク