Adversarial Coreset Selection for Efficient Robust Training

要約

ニューラル ネットワークは、敵対的な攻撃に対して脆弱です。巧妙に作成された知覚できない摂動を入力に追加すると、出力が変更される可能性があります。
敵対的トレーニングは、そのような攻撃に対して堅牢なモデルをトレーニングするための最も効果的なアプローチの 1 つです。
残念ながら、この方法は、反復ごとにトレーニング データ全体の敵対的な例を構築する必要があるため、ニューラル ネットワークのバニラ トレーニングよりもはるかに遅くなります。
コアセット選択の理論を活用することで、トレーニング データの小さなサブセットを選択することで、堅牢なトレーニングの時間の複雑さを軽減するための原則的なアプローチがどのように提供されるかを示します。
この目的のために、まず、敵対的なコアセットの選択に収束の保証を提供します。
特に、収束限界は、コアセットがトレーニング データ全体で計算された勾配をどれだけうまく近似できるかに直接関係していることを示しています。
理論的分析に動機付けられて、この勾配近似誤差を敵対的なコアセット選択の目的として使用して、トレーニングセットのサイズを効果的に削減することを提案します。
構築したら、このトレーニング データのサブセットに対して敵対的トレーニングを実行します。
既存の方法とは異なり、私たちのアプローチは、TRADES、$\ell_p$-PGD、Perceptual Adversarial Training など、さまざまなトレーニング目的に適応できます。
大規模な実験を行って、クリーンで堅牢な精度がわずかに低下する一方で、私たちのアプローチが敵対的トレーニングを 2 ~ 3 倍高速化することを実証します。

要約(オリジナル)

Neural networks are vulnerable to adversarial attacks: adding well-crafted, imperceptible perturbations to their input can modify their output. Adversarial training is one of the most effective approaches to training robust models against such attacks. Unfortunately, this method is much slower than vanilla training of neural networks since it needs to construct adversarial examples for the entire training data at every iteration. By leveraging the theory of coreset selection, we show how selecting a small subset of training data provides a principled approach to reducing the time complexity of robust training. To this end, we first provide convergence guarantees for adversarial coreset selection. In particular, we show that the convergence bound is directly related to how well our coresets can approximate the gradient computed over the entire training data. Motivated by our theoretical analysis, we propose using this gradient approximation error as our adversarial coreset selection objective to reduce the training set size effectively. Once built, we run adversarial training over this subset of the training data. Unlike existing methods, our approach can be adapted to a wide variety of training objectives, including TRADES, $\ell_p$-PGD, and Perceptual Adversarial Training. We conduct extensive experiments to demonstrate that our approach speeds up adversarial training by 2-3 times while experiencing a slight degradation in the clean and robust accuracy.

arxiv情報

著者 Hadi M. Dolatabadi,Sarah Erfani,Christopher Leckie
発行日 2022-09-13 07:37:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク