A Unified Approach to Interpreting and Boosting Adversarial Transferability

要約

本論文では、敵対的摂動内部の相互作用を利用して、敵対的伝達性を説明し、高める。我々は、敵対的伝達可能性と敵対的摂動内部の相互作用の間に負の相関があることを発見し、証明する。この負の相関は、様々な入力を持つ様々なDNNによってさらに検証される。さらに、この負の相関は、現在の伝達可能性を高める手法を理解するための統一的な視点とみなすことができる。この目的のため、我々は、伝達性を向上させる古典的な手法のいくつかは、敵対的摂動内部での相互作用を本質的に減少させることを証明する。これに基づき、我々は攻撃プロセス中の相互作用に直接ペナルティを与えることを提案し、これにより敵対的な伝達可能性を大幅に改善する。

要約(オリジナル)

In this paper, we use the interaction inside adversarial perturbations to explain and boost the adversarial transferability. We discover and prove the negative correlation between the adversarial transferability and the interaction inside adversarial perturbations. The negative correlation is further verified through different DNNs with various inputs. Moreover, this negative correlation can be regarded as a unified perspective to understand current transferability-boosting methods. To this end, we prove that some classic methods of enhancing the transferability essentially decease interactions inside adversarial perturbations. Based on this, we propose to directly penalize interactions during the attacking process, which significantly improves the adversarial transferability.

arxiv情報

著者 Xin Wang,Jie Ren,Shuyun Lin,Xiangming Zhu,Yisen Wang,Quanshi Zhang
発行日 2023-12-01 12:49:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク