Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent Diffusion Model


敵対的攻撃には、ソース画像に摂動を加えてターゲット モデルによる誤分類を引き起こすことが含まれており、これは顔認識モデルを攻撃する可能性を示しています。
この論文では、生のピクセル空間ではなく、潜在空間で知覚できない敵対的アイデンティティ摂動を生成できる統一フレームワーク Adv-Diffusion を提案します。これは、潜在拡散モデルの強力な修復機能を利用して現実的な敵対的画像を生成します。
公開されている FFHQ および CelebA-HQ データセットに対する広範な定性的および定量的実験により、提案された方法が追加の生成モデル トレーニング プロセスなしで最先端の方法と比較して優れたパフォーマンスを達成することが証明されました。
ソース コードは で入手できます。


Adversarial attacks involve adding perturbations to the source image to cause misclassification by the target model, which demonstrates the potential of attacking face recognition models. Existing adversarial face image generation methods still can’t achieve satisfactory performance because of low transferability and high detectability. In this paper, we propose a unified framework Adv-Diffusion that can generate imperceptible adversarial identity perturbations in the latent space but not the raw pixel space, which utilizes strong inpainting capabilities of the latent diffusion model to generate realistic adversarial images. Specifically, we propose the identity-sensitive conditioned diffusion generative model to generate semantic perturbations in the surroundings. The designed adaptive strength-based adversarial perturbation algorithm can ensure both attack transferability and stealthiness. Extensive qualitative and quantitative experiments on the public FFHQ and CelebA-HQ datasets prove the proposed method achieves superior performance compared with the state-of-the-art methods without an extra generative model training process. The source code is available at


著者 Decheng Liu,Xijun Wang,Chunlei Peng,Nannan Wang,Ruiming Hu,Xinbo Gao
発行日 2023-12-28 07:58:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク