AMS-DRL: Learning Multi-Pursuit Evasion for Safe Targeted Navigation of Drones



– 複数のパーサーからの攻撃が存在する状況下で、ドローンの安全なナビゲーションは課題である。
– AMS-DRL(非同期多段階深層強化学習)を用いた新しい手法を提案し、複数のパーサーの行動から学ぶ敵対的ニューラルネットワークをトレーニングさせることで、ドローンが攻撃を回避し、目標に到達できるようにする。
– Nash Equilibrium(ナッシュ均衡)を保証することで、ゲーム理論的分析からエージェント間で収束が保証される。
– シミュレーションでの評価により、ナビゲーションの成功率が高いベースラインを上回ることが示された。
– 相対的な最大速度などのパラメータがナビゲーションのパフォーマンスにどのように影響するかについても分析された。
– 実証実験を行い、トレーニングされたポリシーの効果をリアルタイムフライトで検証した。
– 空間幾何学がナビゲーションの結果にどのように影響するかを示すために、成功率のヒートマップが紹介されている。プロジェクトのウェブサイト:


Safe navigation of drones in the presence of adversarial physical attacks from multiple pursuers is a challenging task. This paper proposes a novel approach, asynchronous multi-stage deep reinforcement learning (AMS-DRL), to train an adversarial neural network that can learn from the actions of multiple pursuers and adapt quickly to their behavior, enabling the drone to avoid attacks and reach its target. Our approach guarantees convergence by ensuring Nash Equilibrium among agents from the game-theory analysis. We evaluate our method in extensive simulations and show that it outperforms baselines with higher navigation success rates. We also analyze how parameters such as the relative maximum speed affect navigation performance. Furthermore, we have conducted physical experiments and validated the effectiveness of the trained policies in real-time flights. A success rate heatmap is introduced to elucidate how spatial geometry influences navigation outcomes. Project website:


著者 Jiaping Xiao,Mir Feroskhan
発行日 2023-04-07 01:59:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.RO パーマリンク