A Bias-Free Training Paradigm for More General AI-generated Image Detection

要約

成功したフォレンジック検出器は、教師あり学習ベンチマークで優れた結果を生み出すことができますが、現実世界のアプリケーションに移行するのは困難です。
この制限は主に、トレーニング データの品質が不十分であることが原因であると考えられます。
ほとんどの研究は新しいアルゴリズムの開発に焦点を当てていますが、コンテンツ、形式、解像度などの誤った相関によってパフォーマンスが大きな影響を受ける可能性があるという証拠があるにもかかわらず、トレーニング データの選択にはあまり注目されていません。
適切に設計されたフォレンジック検出器は、データのバイアスを反映するのではなく、ジェネレーター固有のアーティファクトを検出する必要があります。
この目的を達成するために、我々は、安定した拡散モデルの調整手順を使用して本物の画像から偽の画像を生成する、バイアスのないトレーニング パラダイムである B-Free を提案します。
これにより、本物の画像と偽の画像の間でセマンティックな整合性が確保され、AI 生成によって導入された微妙なアーティファクトのみに起因する差異が許容されます。
コンテンツベースの拡張を通じて、最先端の検出器と比べて汎用性と堅牢性の両方が大幅に向上し、FLUX や Stable Diffusion 3.5 などの最近のリリースを含む 27 の異なる生成モデルにわたってより校正された結果が得られることを示しています。
私たちの調査結果は、慎重なデータセットのキュレーションの重要性を強調し、データセット設計におけるさらなる研究の必要性を強調しています。
コードとデータは https://grip-unina.github.io/B-Free/ で公開されます。

要約(オリジナル)

Successful forensic detectors can produce excellent results in supervised learning benchmarks but struggle to transfer to real-world applications. We believe this limitation is largely due to inadequate training data quality. While most research focuses on developing new algorithms, less attention is given to training data selection, despite evidence that performance can be strongly impacted by spurious correlations such as content, format, or resolution. A well-designed forensic detector should detect generator specific artifacts rather than reflect data biases. To this end, we propose B-Free, a bias-free training paradigm, where fake images are generated from real ones using the conditioning procedure of stable diffusion models. This ensures semantic alignment between real and fake images, allowing any differences to stem solely from the subtle artifacts introduced by AI generation. Through content-based augmentation, we show significant improvements in both generalization and robustness over state-of-the-art detectors and more calibrated results across 27 different generative models, including recent releases, like FLUX and Stable Diffusion 3.5. Our findings emphasize the importance of a careful dataset curation, highlighting the need for further research in dataset design. Code and data will be publicly available at https://grip-unina.github.io/B-Free/

arxiv情報

著者 Fabrizio Guillaro,Giada Zingarini,Ben Usman,Avneesh Sud,Davide Cozzolino,Luisa Verdoliva
発行日 2024-12-23 15:54:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク