Efficient Image-to-Image Diffusion Classifier for Adversarial Robustness

要約

拡散モデル(DM)は、DMベースの防御方法が敵対的な訓練なしで優れた防御能力を達成できる敵対的な堅牢性の分野で大きな可能性を実証しています。
ただし、大規模な事前訓練を受けたDMSの使用により、それらはすべて膨大な計算コストを必要としているため、強力な攻撃の下で完全な評価を実施し、従来のCNNベースの方法と比較することが困難です。
DMSのネットワークサイズとタイムステップを単純に縮小するだけで、以前のフレームワークを無効にする画像生成品質を大幅に害する可能性があります。
この問題を軽減するために、拡散フレームワークを高品質の画像の生成から識別可能な画像ラベルの予測に再設計します。
具体的には、イメージ翻訳フレームワークを使用して、入力サンプルから設計された直交画像ラベルまでの多くのマッピングを学習します。
このフレームワークに基づいて、剪定されたU-NET構造と拡散タイムステップを減らした効率的な画像間拡散分類器を導入します。
フレームワークに加えて、DMSの最適化目標を再設計して、画像分類のターゲットに適合します。ここでは、新しい分類損失がDMベースの画像翻訳フレームワークに組み込まれ、生成されたラベルを他のクラスのラベルと区別します。
人気のあるベンチマークに対するさまざまな攻撃の下で、提案された分類器の十分な評価を実施します。
広範な実験は、DMベースおよびCNNベースの方法よりも計算コストが少なく、私たちの方法がより良い敵対的堅牢性を達成することを示しています。
このコードは、https://github.com/hfmei/idcで入手できます

要約(オリジナル)

Diffusion models (DMs) have demonstrated great potential in the field of adversarial robustness, where DM-based defense methods can achieve superior defense capability without adversarial training. However, they all require huge computational costs due to the usage of large-scale pre-trained DMs, making it difficult to conduct full evaluation under strong attacks and compare with traditional CNN-based methods. Simply reducing the network size and timesteps in DMs could significantly harm the image generation quality, which invalidates previous frameworks. To alleviate this issue, we redesign the diffusion framework from generating high-quality images to predicting distinguishable image labels. Specifically, we employ an image translation framework to learn many-to-one mapping from input samples to designed orthogonal image labels. Based on this framework, we introduce an efficient Image-to-Image diffusion classifier with a pruned U-Net structure and reduced diffusion timesteps. Besides the framework, we redesign the optimization objective of DMs to fit the target of image classification, where a new classification loss is incorporated in the DM-based image translation framework to distinguish the generated label from those of other classes. We conduct sufficient evaluations of the proposed classifier under various attacks on popular benchmarks. Extensive experiments show that our method achieves better adversarial robustness with fewer computational costs than DM-based and CNN-based methods. The code is available at https://github.com/hfmei/IDC

arxiv情報

著者 Hefei Mei,Minjing Dong,Chang Xu
発行日 2025-02-11 14:38:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク