Universal Adversarial Directions


タイトル: ユニバーサルアドバーサリアルディレクション

– DNNは、画像認識タスクにおいて大きな成功を収めているが、ユニバーサルなアドバーサリアルパーティクル(UAP)に対して弱いことが観察されている。
– UAPは一つのパーティクルベクトルですべての入力サンプルを変化させることができるが、DNNアーキテクチャ間での転送性の問題がある。
– この研究では、分類器とUAPの相手プレイヤーの間のユニバーサルアドバーサリアル例ゲームの均衡を分析することで、UAPの転移性を研究した。
– 穏やかな仮定の下、均衡が成立せず、UAPがDNN分類器間での転送性の問題を抱えていることを示した。
– この問題に対処するために、ユニバーサルアドバーサリアルディレクション(UAD)を提案した。UADは、アドバーサリアルパーティクルのユニバーサルな方向しか固定せず、パーティクルの振幅をサンプルごとに自由に選択することができる。
– UADの最適化問題を主成分分析(PCA)に関連付け、UADを最適化するための効率的なPCAベースのアルゴリズムを開発した。
– 複数のベンチマーク画像データセットでUADを評価した。数値結果は、標準的な勾配ベースのUAPに比べてUADの転移性が優れていることを示している。


Despite their great success in image recognition tasks, deep neural networks (DNNs) have been observed to be susceptible to universal adversarial perturbations (UAPs) which perturb all input samples with a single perturbation vector. However, UAPs often struggle in transferring across DNN architectures and lead to challenging optimization problems. In this work, we study the transferability of UAPs by analyzing equilibrium in the universal adversarial example game between the classifier and UAP adversary players. We show that under mild assumptions the universal adversarial example game lacks a pure Nash equilibrium, indicating UAPs’ suboptimal transferability across DNN classifiers. To address this issue, we propose Universal Adversarial Directions (UADs) which only fix a universal direction for adversarial perturbations and allow the perturbations’ magnitude to be chosen freely across samples. We prove that the UAD adversarial example game can possess a Nash equilibrium with a pure UAD strategy, implying the potential transferability of UADs. We also connect the UAD optimization problem to the well-known principal component analysis (PCA) and develop an efficient PCA-based algorithm for optimizing UADs. We evaluate UADs over multiple benchmark image datasets. Our numerical results show the superior transferability of UADs over standard gradient-based UAPs.


著者 Ching Lam Choi,Farzan Farnia
発行日 2023-04-16 16:10:24+00:00
arxiv_id(pdf)

カテゴリー: cs.AI, cs.CR, cs.LG, stat.ML パーマリンク