Adversarial Example Soups: Improving Transferability and Stealthiness for Free

要約

転送可能な敵対的な例は、内部知識を知らずにターゲット モデルを誤解させる可能性があるため、実際的なセキュリティ リスクを引き起こします。
転送可能性を最大化するための従来のレシピは、最適化パイプラインで取得されたすべての敵対的な例から最適な敵対的な例のみを保持することです。
この論文では、初めてこの慣習に疑問を呈し、廃棄された次善の敵対的な例を再利用して移転性を高めることができることを実証します。
具体的には、ハイパーパラメータ調整で破棄された敵対的サンプルを平均化するための AES-tune と、安定性テストのための AES-rand を備えた「Adversarial Example Soups」(AES) を提案します。
さらに、当社の AES は、複数の微調整されたモデルの重みを平均して、推論時間を増加させることなく精度を向上させる「モデル スープ」からインスピレーションを得ています。
広範な実験により、当社の AES の世界的な有効性が検証され、10 の多様な (防御) ターゲット モデルに対して 10 の最先端の転送攻撃とその組み合わせを最大 13% 強化します。
また、AES を他のタイプに一般化する可能性、たとえば、同等の成功をもたらす実際の複数の敵対的例を直接平均する可能性も示します。
AES の有望な副産物は、摂動の分散が自然に減少するため、敵対的な例のステルス性が向上することです。

要約(オリジナル)

Transferable adversarial examples cause practical security risks since they can mislead a target model without knowing its internal knowledge. A conventional recipe for maximizing transferability is to keep only the optimal adversarial example from all those obtained in the optimization pipeline. In this paper, for the first time, we question this convention and demonstrate that those discarded, sub-optimal adversarial examples can be reused to boost transferability. Specifically, we propose “Adversarial Example Soups” (AES), with AES-tune for averaging discarded adversarial examples in hyperparameter tuning and AES-rand for stability testing. In addition, our AES is inspired by “model soups”, which averages weights of multiple fine-tuned models for improved accuracy without increasing inference time. Extensive experiments validate the global effectiveness of our AES, boosting 10 state-of-the-art transfer attacks and their combinations by up to 13% against 10 diverse (defensive) target models. We also show the possibility of generalizing AES to other types, e.g., directly averaging multiple in-the-wild adversarial examples that yield comparable success. A promising byproduct of AES is the improved stealthiness of adversarial examples since the perturbation variances are naturally reduced.

arxiv情報

著者 Bo Yang,Hengwei Zhang,Jindong Wang,Yulong Yang,Chenhao Lin,Chao Shen,Zhengyu Zhao
発行日 2024-04-30 14:13:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク