Universal Adversarial Defense in Remote Sensing Based on Pre-trained Denoising Diffusion Models

要約

ディープ ニューラル ネットワーク (DNN) は、地球観測用の多数の AI アプリケーション (AI4EO) における主要なソリューションとして注目を集めています。
ただし、敵対的な例に対する影響を受けやすいため、AI4EO アルゴリズムの信頼性が損なわれるという重大な課題が生じています。
この論文では、リモート センシング画像 (UAD-RS) における新しい普遍的敵対的防御アプローチを紹介します。これは、事前トレーニングされた拡散モデルを活用して、異種パターンを示す普遍的敵対的例から DNN を保護します。
具体的には、事前トレーニングされた拡散モデルを利用して、ガウス ノイズの導入とその後の敵対例からの摂動の浄化を通じて敵対的な摂動を軽減する普遍的な敵対的浄化フレームワークが開発されます。
さらに、適応型ノイズ レベル選択 (ANLS) メカニズムが導入され、タスクに基づいたフレシェ インセプション ディスタンス (FID) ランキング戦略を使用して浄化フレームワークの最適なノイズ レベルを決定するため、浄化パフォーマンスが向上します。
その結果、各データセットにわたる異種パターンを持つ普遍的な敵対的サンプルを精製するには、事前にトレーニングされた拡散モデルが 1 つだけ必要となり、敵対的な摂動に関する事前知識がなくても高いパフォーマンスを維持しながら、複数の攻撃設定のトレーニングの労力を大幅に削減できます。
シーン分類とセマンティック セグメンテーションに焦点を当てた 4 つの異種 RS データセットに関する実験結果は、UAD-RS が最先端の敵対的浄化アプローチを上回り、一般的に遭遇する 7 つの敵対的摂動に対する普遍的な防御を提供することを実証しています。
コードと事前トレーニングされたモデルはオンラインで入手できます (https://github.com/EricYu97/UAD-RS)。

要約(オリジナル)

Deep neural networks (DNNs) have risen to prominence as key solutions in numerous AI applications for earth observation (AI4EO). However, their susceptibility to adversarial examples poses a critical challenge, compromising the reliability of AI4EO algorithms. This paper presents a novel Universal Adversarial Defense approach in Remote Sensing Imagery (UAD-RS), leveraging pre-trained diffusion models to protect DNNs against universal adversarial examples exhibiting heterogeneous patterns. Specifically, a universal adversarial purification framework is developed utilizing pre-trained diffusion models to mitigate adversarial perturbations through the introduction of Gaussian noise and subsequent purification of the perturbations from adversarial examples. Additionally, an Adaptive Noise Level Selection (ANLS) mechanism is introduced to determine the optimal noise level for the purification framework with a task-guided Frechet Inception Distance (FID) ranking strategy, thereby enhancing purification performance. Consequently, only a single pre-trained diffusion model is required for purifying universal adversarial samples with heterogeneous patterns across each dataset, significantly reducing training efforts for multiple attack settings while maintaining high performance without prior knowledge of adversarial perturbations. Experimental results on four heterogeneous RS datasets, focusing on scene classification and semantic segmentation, demonstrate that UAD-RS outperforms state-of-the-art adversarial purification approaches, providing universal defense against seven commonly encountered adversarial perturbations. Codes and the pre-trained models are available online (https://github.com/EricYu97/UAD-RS).

arxiv情報

著者 Weikang Yu,Yonghao Xu,Pedram Ghamisi
発行日 2024-05-27 14:23:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク