Generating Adversarial Examples with Better Transferability via Masking Unimportant Parameters of Surrogate Model

要約

タイトル:置換モデルの重要でないパラメータのマスキングにより、より転移性の高い悪意のある事例を生成する

要約:
– DNNは、悪意のある事例に対して脆弱であることが示されている。
– さらに、近年、悪意のある事例の転移性が広く注目されており、置換モデルによって生成された悪意のある事例が未知のモデルを攻撃することができることがわかった。
– この現象は、転移ベースの攻撃を生み出し、生成された悪意のある事例の転移性を改善することを目的としている。
– 本論文では、転移ベースの攻撃における悪意のある事例の転移性を改善するために、重要でないパラメータをマスキングする手法(MUP)を提案している。
– MUPのキーとなるアイデアは、事前学習された置換モデルを改善し、転移ベースの攻撃を促進することである。
– このアイデアに基づいて、Taylor展開ベースのメトリックを使用してパラメータの重要性スコアを評価し、悪意のある事例の生成中に重要でないパラメータをマスクする。
– このプロセスはシンプルであり、既存の勾配ベースの最適化アルゴリズムと自然に組み合わせることができるため、生成された悪意のある事例の転移性をさらに改善することができる。
– 提案されたMUPベースのメソッドの効果を検証するために、広範な実験が実施されている。

要約(オリジナル)

Deep neural networks (DNNs) have been shown to be vulnerable to adversarial examples. Moreover, the transferability of the adversarial examples has received broad attention in recent years, which means that adversarial examples crafted by a surrogate model can also attack unknown models. This phenomenon gave birth to the transfer-based adversarial attacks, which aim to improve the transferability of the generated adversarial examples. In this paper, we propose to improve the transferability of adversarial examples in the transfer-based attack via masking unimportant parameters (MUP). The key idea in MUP is to refine the pretrained surrogate models to boost the transfer-based attack. Based on this idea, a Taylor expansion-based metric is used to evaluate the parameter importance score and the unimportant parameters are masked during the generation of adversarial examples. This process is simple, yet can be naturally combined with various existing gradient-based optimizers for generating adversarial examples, thus further improving the transferability of the generated adversarial examples. Extensive experiments are conducted to validate the effectiveness of the proposed MUP-based methods.

arxiv情報

著者 Dingcheng Yang,Wenjian Yu,Zihao Xiao,Jiaqi Luo
発行日 2023-04-14 03:06:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CR, cs.CV, cs.LG パーマリンク