MIXPGD: Hybrid Adversarial Training for Speech Recognition Systems

要約

ディープ ニューラル ネットワークに基づく自動音声認識 (ASR) システムは、敵対的摂動に対して弱いです。
ASRシステムのモデルのロバスト性を改善するために、mixPGD敵対的トレーニング方法を提案します。
標準的な敵対的トレーニングでは、教師ありまたは教師なしの方法を活用して敵対的サンプルが生成されます。
私たちの方法では、教師ありと教師なしの両方のアプローチの機能を統合して、モデルの堅牢性の向上に役立つ新しい敵対的サンプルを生成します。
ホワイトボックスの敵対的攻撃設定の下で、mixPGD が以前の最高のパフォーマンスを発揮したモデルよりも 4.1% WER 優れたパフォーマンスを獲得することを示すために、さまざまな最先端の防御方法と敵対的攻撃にわたる広範な実験と比較が行われました。
ホワイトボックスと転送ベースのブラックボックス攻撃設定の両方に対して提案された防御方法をテストし、防御戦略がさまざまな種類の攻撃に対して堅牢であることを確認しました。
いくつかの敵対的攻撃に関する経験的結果は、提案されたアプローチの有効性を検証します。

要約(オリジナル)

Automatic speech recognition (ASR) systems based on deep neural networks are weak against adversarial perturbations. We propose mixPGD adversarial training method to improve the robustness of the model for ASR systems. In standard adversarial training, adversarial samples are generated by leveraging supervised or unsupervised methods. We merge the capabilities of both supervised and unsupervised approaches in our method to generate new adversarial samples which aid in improving model robustness. Extensive experiments and comparison across various state-of-the-art defense methods and adversarial attacks have been performed to show that mixPGD gains 4.1% WER of better performance than previous best performing models under white-box adversarial attack setting. We tested our proposed defense method against both white-box and transfer based black-box attack settings to ensure that our defense strategy is robust against various types of attacks. Empirical results on several adversarial attacks validate the effectiveness of our proposed approach.

arxiv情報

著者 Aminul Huq,Weiyi Zhang,Xiaolin Hu
発行日 2023-03-10 07:52:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク