The Enemy of My Enemy is My Friend: Exploring Inverse Adversaries for Improving Adversarial Training


現在の深層学習技術は、さまざまなコンピューター ビジョン タスクで優れたパフォーマンスを発揮していますが、依然として敵対的な例に対して脆弱です。
さまざまなビジョン データセットとアーキテクチャに関する広範な実験により、トレーニング方法が最先端の堅牢性と自然な精度を達成することが実証されています。
さらに、逆敵対的サンプルのユニバーサル バージョンを使用して、低計算コストで単一ステップの敵対的トレーニング手法のパフォーマンスを向上させます。


Although current deep learning techniques have yielded superior performance on various computer vision tasks, yet they are still vulnerable to adversarial examples. Adversarial training and its variants have been shown to be the most effective approaches to defend against adversarial examples. These methods usually regularize the difference between output probabilities for an adversarial and its corresponding natural example. However, it may have a negative impact if the model misclassifies a natural example. To circumvent this issue, we propose a novel adversarial training scheme that encourages the model to produce similar outputs for an adversarial example and its “inverse adversarial” counterpart. These samples are generated to maximize the likelihood in the neighborhood of natural examples. Extensive experiments on various vision datasets and architectures demonstrate that our training method achieves state-of-the-art robustness as well as natural accuracy. Furthermore, using a universal version of inverse adversarial examples, we improve the performance of single-step adversarial training techniques at a low computational cost.


著者 Junhao Dong,Seyed-Mohsen Moosavi-Dezfooli,Jianhuang Lai,Xiaohua Xie
発行日 2022-11-01 15:24:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG パーマリンク