Intercepting Unauthorized Aerial Robots in Controlled Airspace Using Reinforcement Learning

要約

管制空域における無人航空機(UAV)の急増は、衝突の可能性、航空交通の混乱、安全上の脅威などの重大なリスクをもたらします。
特に都市環境や重要インフラの近くで空域の安全かつ効率的な運用を確保するには、無許可または非協力的な UAV を迎撃する効果的な方法が必要です。
この取り組みは、強化学習 (RL) を使用してそのような脅威を管理できる堅牢で適応性のあるシステムに対する重要なニーズに対処します。
動的回避ターゲットを迎撃するために固定翼 UAV 追跡エージェントを訓練するために RL を利用した新しいアプローチを紹介します。
私たちの方法論では、モデルベースとモデルフリーの両方の RL アルゴリズム、特に DreamerV3、Truncated Quantile Critics (TQC)、および Soft Actor-Critic (SAC) を調査します。
これらのアルゴリズムのトレーニングと評価は、目に見えない回避戦略や環境の混乱など、さまざまなシナリオの下で実施されました。
私たちのアプローチは、忠実度の高い飛行力学シミュレーションを活用して、現実的なトレーニング環境を作成します。
この研究は、安全で効率的な空域管理の進歩に大きく貢献する、UAV 迎撃用のインテリジェントで適応性のある制御システムを開発することの重要性を強調しています。
これは、これらの重要なタスクを自律的に達成できるシステムをトレーニングする RL の可能性を示しています。

要約(オリジナル)

The proliferation of unmanned aerial vehicles (UAVs) in controlled airspace presents significant risks, including potential collisions, disruptions to air traffic, and security threats. Ensuring the safe and efficient operation of airspace, particularly in urban environments and near critical infrastructure, necessitates effective methods to intercept unauthorized or non-cooperative UAVs. This work addresses the critical need for robust, adaptive systems capable of managing such threats through the use of Reinforcement Learning (RL). We present a novel approach utilizing RL to train fixed-wing UAV pursuer agents for intercepting dynamic evader targets. Our methodology explores both model-based and model-free RL algorithms, specifically DreamerV3, Truncated Quantile Critics (TQC), and Soft Actor-Critic (SAC). The training and evaluation of these algorithms were conducted under diverse scenarios, including unseen evasion strategies and environmental perturbations. Our approach leverages high-fidelity flight dynamics simulations to create realistic training environments. This research underscores the importance of developing intelligent, adaptive control systems for UAV interception, significantly contributing to the advancement of secure and efficient airspace management. It demonstrates the potential of RL to train systems capable of autonomously achieving these critical tasks.

arxiv情報

著者 Francisco Giral,Ignacio Gómez,Soledad Le Clainche
発行日 2024-07-09 14:45:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク