Robust Adversarial Attacks Detection based on Explainable Deep Reinforcement Learning For UAV Guidance and Planning


公共の場で活動する無人航空機 (UAV) エージェントに対する敵対的な攻撃の危険性が高まっています。
これらの UAV を制御および誘導するために AI ベースの技術、より具体的には深層学習 (DL) アプローチを採用することは、パフォーマンスの点で有益ですが、これらの技術の安全性と敵対的な攻撃に対する脆弱性に関する懸念が高まる可能性があります。
これらの攻撃によって引き起こされるエージェントの意思決定プロセスの混乱は、UAV の安全性に重大な影響を与える可能性があります。
この論文では、DL 方式とそれを採用する UAV を攻撃から保護する効率的な検出器を構築するための、DL 方式の説明可能性に基づいた革新的なアプローチを提案します。
エージェントは、ガイダンスと計画のために深層強化学習 (DRL) スキームを採用しています。
エージェントは、人工ポテンシャル フィールド (APF) を利用してトレーニング時間と障害物回避パフォーマンスを向上させる優先エクスペリエンス リプレイ (PER) DRL スキームを備えた Deep Deterministic Policy Gradient (DDPG) でトレーニングされます。
障害物や敵対的攻撃を含む、UAV が説明可能な DRL ベースの計画とガイダンスのためのシミュレート環境が構築されます。
敵対的攻撃は基本反復法 (BIM) アルゴリズムによって生成され、障害物コースの完了率が 97\% から 35\% に低下します。
この減少に対抗するために、2 つの敵対的攻撃検出器が提案されています。
1 つ目は畳み込みニューラル ネットワーク敵対的検出器 (CNN-AD) で、80% の検出精度を達成します。
2 番目の検出器は、Long Short Term Memory (LSTM) ネットワークを利用します。
CNN-AD と比較して高速な計算時間で 91\% の精度を達成し、リアルタイムの敵対的検出を可能にします。


The dangers of adversarial attacks on Uncrewed Aerial Vehicle (UAV) agents operating in public are increasing. Adopting AI-based techniques and, more specifically, Deep Learning (DL) approaches to control and guide these UAVs can be beneficial in terms of performance but can add concerns regarding the safety of those techniques and their vulnerability against adversarial attacks. Confusion in the agent’s decision-making process caused by these attacks can seriously affect the safety of the UAV. This paper proposes an innovative approach based on the explainability of DL methods to build an efficient detector that will protect these DL schemes and the UAVs adopting them from attacks. The agent adopts a Deep Reinforcement Learning (DRL) scheme for guidance and planning. The agent is trained with a Deep Deterministic Policy Gradient (DDPG) with Prioritised Experience Replay (PER) DRL scheme that utilises Artificial Potential Field (APF) to improve training times and obstacle avoidance performance. A simulated environment for UAV explainable DRL-based planning and guidance, including obstacles and adversarial attacks, is built. The adversarial attacks are generated by the Basic Iterative Method (BIM) algorithm and reduced obstacle course completion rates from 97\% to 35\%. Two adversarial attack detectors are proposed to counter this reduction. The first one is a Convolutional Neural Network Adversarial Detector (CNN-AD), which achieves accuracy in the detection of 80\%. The second detector utilises a Long Short Term Memory (LSTM) network. It achieves an accuracy of 91\% with faster computing times compared to the CNN-AD, allowing for real-time adversarial detection.


著者 Thomas Hickling,Nabil Aouf,Phillippa Spencer
発行日 2023-06-20 16:07:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CR, cs.LG, cs.RO パーマリンク