PatchCraft: Exploring Texture Patch for Efficient AI-generated Image Detection


AI が生成したこのような信じられないほどリアルな画像を、人間は本物の画像と区別することはほとんどできません。
AI が生成した画像は、偽情報の蔓延につながる可能性があります。
したがって、AI が生成した画像を識別する検出器の開発が最も急務となっています。
この論文では、幅広い生成モデルによって作成された偽画像を識別できる新しい AI 生成画像検出器を提案します。
画像のテクスチャ パッチは、画像のグローバルな意味情報と比較して、生成モデルによって残された痕跡をより多く明らかにする傾向があることが観察されています。
新しい Smash&Reconstruction 前処理は、グローバル セマンティック情報を消去し、テクスチャ パッチを強化するために提案されています。
さらに、既存のベースラインとアプローチの有効性を評価するために、17 種類の一般的な生成モデルを含む包括的な AI 生成画像検出ベンチマークを構築します。


Recent generative models show impressive performance in generating photographic images. Humans can hardly distinguish such incredibly realistic-looking AI-generated images from real ones. AI-generated images may lead to ubiquitous disinformation dissemination. Therefore, it is of utmost urgency to develop a detector to identify AI generated images. Most existing detectors suffer from sharp performance drops over unseen generative models. In this paper, we propose a novel AI-generated image detector capable of identifying fake images created by a wide range of generative models. We observe that the texture patches of images tend to reveal more traces left by generative models compared to the global semantic information of the images. A novel Smash&Reconstruction preprocessing is proposed to erase the global semantic information and enhance texture patches. Furthermore, pixels in rich texture regions exhibit more significant fluctuations than those in poor texture regions. Synthesizing realistic rich texture regions proves to be more challenging for existing generative models. Based on this principle, we leverage the inter-pixel correlation contrast between rich and poor texture regions within an image to further boost the detection performance. In addition, we build a comprehensive AI-generated image detection benchmark, which includes 17 kinds of prevalent generative models, to evaluate the effectiveness of existing baselines and our approach. Our benchmark provides a leaderboard for follow-up studies. Extensive experimental results show that our approach outperforms state-of-the-art baselines by a significant margin. Our project:


著者 Nan Zhong,Yiran Xu,Sheng Li,Zhenxing Qian,Xinpeng Zhang
発行日 2024-03-07 14:26:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク