Introducing Adaptive Continuous Adversarial Training (ACAT) to Enhance ML Robustness

要約

機械学習 (ML) は、ML モデルを騙して誤った予測を生成させることを目的とした敵対的攻撃の影響を受けやすくなっています。
敵対的トレーニングにより、これらの攻撃に対する ML モデルの堅牢性が向上することがわかりました。
ただし、ネットワークとサイバーセキュリティでは、ラベル付きトレーニング データや敵対的トレーニング データを取得するのは困難であり、コストがかかります。
さらに、コンセプトのドリフトにより、特にネットワークやサイバーセキュリティなどの動的なドメインにおいて課題が深刻化し、定期的な再トレーニングを実施するためにさまざまなモデルが必要になります。
このレターでは、現実世界で検出された敵対的データを使用して、進行中の学習セッション中に敵対的トレーニング サンプルをモデルに継続的に統合し、進化する敵対的脅威に対するモデルの回復力を強化する適応型連続敵対的トレーニング (ACAT) を紹介します。
ACAT は、定期的な再トレーニングを利用して敵対的な攻撃に効果的に対抗し、壊滅的な忘却を軽減する適応防御メカニズムです。
また、私たちのアプローチは、特に攻撃率が非常に高いネットワーク セキュリティなどの環境において、敵対的サンプルの検出に必要な合計時間を短縮します。
2 つの段階を伴う従来の検出プロセスでは、手順が長くなる可能性があります。
SPAM 検出データセットを使用した実験結果は、ACAT を使用すると、わずか 3 回の再トレーニング セッションで SPAM フィルターの精度が 69% から 88% 以上に向上したことを示しています。
さらに、ACAT は従来の敵対的サンプル検出器よりも優れた性能を発揮し、場合によっては最大 4 倍の高速な決定時間を実現します。

要約(オリジナル)

Machine Learning (ML) is susceptible to adversarial attacks that aim to trick ML models, making them produce faulty predictions. Adversarial training was found to increase the robustness of ML models against these attacks. However, in network and cybersecurity, obtaining labeled training and adversarial training data is challenging and costly. Furthermore, concept drift deepens the challenge, particularly in dynamic domains like network and cybersecurity, and requires various models to conduct periodic retraining. This letter introduces Adaptive Continuous Adversarial Training (ACAT) to continuously integrate adversarial training samples into the model during ongoing learning sessions, using real-world detected adversarial data, to enhance model resilience against evolving adversarial threats. ACAT is an adaptive defense mechanism that utilizes periodic retraining to effectively counter adversarial attacks while mitigating catastrophic forgetting. Our approach also reduces the total time required for adversarial sample detection, especially in environments such as network security where the rate of attacks could be very high. Traditional detection processes that involve two stages may result in lengthy procedures. Experimental results using a SPAM detection dataset demonstrate that with ACAT, the accuracy of the SPAM filter increased from 69% to over 88% after just three retraining sessions. Furthermore, ACAT outperforms conventional adversarial sample detectors, providing faster decision times, up to four times faster in some cases.

arxiv情報

著者 Mohamed elShehaby,Aditya Kotha,Ashraf Matrawy
発行日 2024-03-15 16:52:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG, cs.NI パーマリンク