Boosting Adversarial Transferability by Block Shuffle and Rotation

要約

敵対的な例は、知覚できない摂動によってディープ ニューラル ネットワークを誤解させ、ディープ ラーニングに重大な脅威をもたらしています。
重要な側面は、その転送可能性です。これは、他のモデルを欺く能力を指し、その結果、ブラックボックス設定での攻撃が可能になります。
転送性を高めるためにさまざまな方法が提案されていますが、その性能はホワイトボックス攻撃に比べてまだ不十分です。
この研究では、主流の転送ベースの攻撃の 1 つである既存の入力変換ベースの攻撃が、さまざまなモデルで異なるアテンション ヒートマップをもたらし、それが転送可能性を制限する可能性があることを観察しました。
また、画像の本質的な関係を壊すと、元の画像のアテンション ヒートマップが破壊される可能性があることもわかりました。
この発見に基づいて、ブロック シャッフル アンド ローテーション (BSR) と呼ばれる新しい入力変換ベースの攻撃を提案します。
具体的には、BSR は入力イメージをいくつかのブロックに分割し、これらのブロックをランダムにシャッフルおよび回転して、勾配計算用の新しいイメージのセットを構築します。
ImageNet データセットの経験的評価では、BSR が単一モデルおよびアンサンブル モデル設定の下で既存の入力変換ベースの方法よりも大幅に優れた転送可能性を達成できることが実証されています。
BSR と電流入力変換方法を組み合わせると、転送可能性がさらに向上し、最先端の方法よりも大幅に優れた性能を発揮します。
コードは https://github.com/Trustworthy-AI-Group/BSR で入手できます。

要約(オリジナル)

Adversarial examples mislead deep neural networks with imperceptible perturbations and have brought significant threats to deep learning. An important aspect is their transferability, which refers to their ability to deceive other models, thus enabling attacks in the black-box setting. Though various methods have been proposed to boost transferability, the performance still falls short compared with white-box attacks. In this work, we observe that existing input transformation based attacks, one of the mainstream transfer-based attacks, result in different attention heatmaps on various models, which might limit the transferability. We also find that breaking the intrinsic relation of the image can disrupt the attention heatmap of the original image. Based on this finding, we propose a novel input transformation based attack called block shuffle and rotation (BSR). Specifically, BSR splits the input image into several blocks, then randomly shuffles and rotates these blocks to construct a set of new images for gradient calculation. Empirical evaluations on the ImageNet dataset demonstrate that BSR could achieve significantly better transferability than the existing input transformation based methods under single-model and ensemble-model settings. Combining BSR with the current input transformation method can further improve the transferability, which significantly outperforms the state-of-the-art methods. Code is available at https://github.com/Trustworthy-AI-Group/BSR

arxiv情報

著者 Kunyu Wang,Xuanran He,Wenxuan Wang,Xiaosen Wang
発行日 2024-03-25 12:04:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク