要約
現在、ディープフェイク画像の高忠実度生成と高精度検出は競争状態にあります。
私たちは、非常に現実的で「検出を回避する」ディープフェイクを作成することで、将来の世代のディープフェイクの検出機能を向上させるという最終目標を達成できると信じています。
この論文では、暗黙的な空間ドメイン ノッチ フィルタリングを実行することで、画質を損なうことなく偽画像のアーティファクト パターンを削減する、シンプルかつ強力なパイプラインを提案します。
まず、周波数領域のノッチ フィルタリングが空間領域の周期性ノイズの除去に効果的であることはよく知られていますが、ノッチ フィルタには手動設計が必要であるため、当面のタスクには実行不可能であることを示します。
したがって、ノッチ フィルター効果を再現するために学習ベースのアプローチを使用しますが、空間領域のみでの再現となります。
周期的なノイズパターンを破壊するための圧倒的な空間ノイズの追加と、ノイズのない偽画像を再構築するためのディープ画像フィルタリングの組み合わせを採用し、この手法を DeepNotch と名付けました。
ディープ画像フィルタリングは、ノイズの多い画像の各ピクセルに特化したフィルタを提供し、DeepFake の対応物と比較して忠実度の高いフィルタリングされた画像を生成します。
さらに、画像の意味情報を使用して敵対的ガイダンス マップを生成し、インテリジェントにノイズを追加します。
3 つの代表的な最先端ディープフェイク検出手法に関する大規模な評価 (16 種類のディープフェイクでテスト) では、我々の技術がこれら 3 つの偽画像検出手法の精度を平均 36.79% から最大 36.79% まで大幅に低下させることが実証されました。
最良の場合は 97.02%。
要約(オリジナル)
The current high-fidelity generation and high-precision detection of DeepFake images are at an arms race. We believe that producing DeepFakes that are highly realistic and ‘detection evasive’ can serve the ultimate goal of improving future generation DeepFake detection capabilities. In this paper, we propose a simple yet powerful pipeline to reduce the artifact patterns of fake images without hurting image quality by performing implicit spatial-domain notch filtering. We first demonstrate that frequency-domain notch filtering, although famously shown to be effective in removing periodic noise in the spatial domain, is infeasible for our task at hand due to the manual designs required for the notch filters. We, therefore, resort to a learning-based approach to reproduce the notch filtering effects, but solely in the spatial domain. We adopt a combination of adding overwhelming spatial noise for breaking the periodic noise pattern and deep image filtering to reconstruct the noise-free fake images, and we name our method DeepNotch. Deep image filtering provides a specialized filter for each pixel in the noisy image, producing filtered images with high fidelity compared to their DeepFake counterparts. Moreover, we also use the semantic information of the image to generate an adversarial guidance map to add noise intelligently. Our large-scale evaluation on 3 representative state-of-the-art DeepFake detection methods (tested on 16 types of DeepFakes) has demonstrated that our technique significantly reduces the accuracy of these 3 fake image detection methods, 36.79% on average and up to 97.02% in the best case.
arxiv情報
著者 | Yihao Huang,Felix Juefei-Xu,Qing Guo,Yang Liu,Geguang Pu |
発行日 | 2024-03-21 16:24:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google