Harmonizing Intra-coherence and Inter-divergence in Ensemble Attacks for Adversarial Transferability

要約

モデルアンサンブル攻撃の開発により、敵対的な例の移植性が大幅に向上したが、この進歩はディープニューラルネットワークのセキュリティに深刻な脅威をもたらしている。しかし、既存の手法は、モデル間で共有される勾配の方向性の捕捉が不十分であることと、適応的な重み割り当てメカニズムの欠如という2つの重大な課題に直面している。これらの問題に対処するために、我々は、敵対的な例生成に初めて領域汎化を導入した、新しい手法Harmonized Ensemble for Adversarial Transferability (HEAT)を提案する。HEATは2つの主要なモジュールから構成される:コンセンサス勾配方向合成器は、特異値分解を用いて共有勾配方向を合成し、デュアルハーモニーウェイトオーケストレータは、個々のモデル内の勾配を安定化させるドメイン内の一貫性と、モデル間の伝達性を高めるドメイン間の多様性のバランスを動的に調整する。実験結果は、HEATが様々なデータセットや設定において既存の手法を大幅に上回ることを実証しており、敵対的攻撃研究に新たな視点と方向性を提供している。

要約(オリジナル)

The development of model ensemble attacks has significantly improved the transferability of adversarial examples, but this progress also poses severe threats to the security of deep neural networks. Existing methods, however, face two critical challenges: insufficient capture of shared gradient directions across models and a lack of adaptive weight allocation mechanisms. To address these issues, we propose a novel method Harmonized Ensemble for Adversarial Transferability (HEAT), which introduces domain generalization into adversarial example generation for the first time. HEAT consists of two key modules: Consensus Gradient Direction Synthesizer, which uses Singular Value Decomposition to synthesize shared gradient directions; and Dual-Harmony Weight Orchestrator which dynamically balances intra-domain coherence, stabilizing gradients within individual models, and inter-domain diversity, enhancing transferability across models. Experimental results demonstrate that HEAT significantly outperforms existing methods across various datasets and settings, offering a new perspective and direction for adversarial attack research.

arxiv情報

著者 Zhaoyang Ma,Zhihao Wu,Wang Lu,Xin Gao,Jinghang Yue,Taolin Zhang,Lipo Wang,Youfang Lin,Jing Wang
発行日 2025-05-02 10:17:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク