ADBM: Adversarial diffusion bridge model for reliable adversarial purification

要約

最近、拡散ベースの精製(拡散)は、敵対例に対する効果的な防御方法として認識されています。
ただし、元の訓練を受けた拡散モデルを敵対的浄化のために直接採用している拡散は、最適ではないことがわかります。
これは、ノイズ浄化のパフォーマンスとデータ回復の質との固有のトレードオフによるものです。
さらに、弱い適応攻撃に依存しているため、既存の評価の信頼性は疑わしいです。
この作業では、ADBMと呼ばれる新しい敵対的な拡散ブリッジモデルを提案します。
ADBMは、拡散した敵対的なデータから元のクリーンな例に戻る逆橋を直接構築し、元の拡散モデルの精製能力を高めます。
さまざまなシナリオにわたる理論分析と実験的検証を通じて、ADBMは優れた堅牢な防御メカニズムであることが証明されており、実用的なアプリケーションに大きな約束を提供しています。

要約(オリジナル)

Recently Diffusion-based Purification (DiffPure) has been recognized as an effective defense method against adversarial examples. However, we find DiffPure which directly employs the original pre-trained diffusion models for adversarial purification, to be suboptimal. This is due to an inherent trade-off between noise purification performance and data recovery quality. Additionally, the reliability of existing evaluations for DiffPure is questionable, as they rely on weak adaptive attacks. In this work, we propose a novel Adversarial Diffusion Bridge Model, termed ADBM. ADBM directly constructs a reverse bridge from the diffused adversarial data back to its original clean examples, enhancing the purification capabilities of the original diffusion models. Through theoretical analysis and experimental validation across various scenarios, ADBM has proven to be a superior and robust defense mechanism, offering significant promise for practical applications.

arxiv情報

著者 Xiao Li,Wenxuan Sun,Huanran Chen,Qiongxiu Li,Yining Liu,Yingzhe He,Jie Shi,Xiaolin Hu
発行日 2025-02-13 15:46:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク