Robust Policy Learning for Multi-UAV Collision Avoidance with Causal Feature Selection

要約

目に見えない複雑な屋外環境において、無人航空機(UAV)群の衝突回避ナビゲーションは困難な問題である。これは、UAVが様々な障害物や複雑な背景をナビゲートすることを必要とする。深層強化学習に基づく既存の衝突回避ナビゲーション手法は、有望な性能を示すが、汎化能力が乏しく、その結果、未見環境での性能劣化に苦しんでいる。この問題に対処するため、我々はDRLにおける弱い汎化能力の原因を調査し、新しい原因特徴選択モジュールを提案する。このモジュールはポリシーネットワークに統合することができ、表現中の非因果的要因を効果的にフィルタリングすることで、非因果的要因と行動予測との間のスプリアス相関の影響を低減します。実験結果は、我々の提案手法が、特に未知の背景や障害物があるシナリオにおいて、ロバストなナビゲーション性能と効果的な衝突回避を達成でき、既存の最先端アルゴリズムを大幅に上回ることを実証する。

要約(オリジナル)

In unseen and complex outdoor environments, collision avoidance navigation for unmanned aerial vehicle (UAV) swarms presents a challenging problem. It requires UAVs to navigate through various obstacles and complex backgrounds. Existing collision avoidance navigation methods based on deep reinforcement learning show promising performance but suffer from poor generalization abilities, resulting in performance degradation in unseen environments. To address this issue, we investigate the cause of weak generalization ability in DRL and propose a novel causal feature selection module. This module can be integrated into the policy network and effectively filters out non-causal factors in representations, thereby reducing the influence of spurious correlations between non-causal factors and action predictions. Experimental results demonstrate that our proposed method can achieve robust navigation performance and effective collision avoidance especially in scenarios with unseen backgrounds and obstacles, which significantly outperforms existing state-of-the-art algorithms.

arxiv情報

著者 Jiafan Zhuang,Gaofei Han
発行日 2024-07-04 16:57:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク