Robust Policy Learning for Multi-UAV Collision Avoidance with Causal Feature Selection

要約

目に見えない複雑な屋外環境では、無人航空機 (UAV) の群れの衝突回避ナビゲーションには困難な問題が生じます。
UAV はさまざまな障害物や複雑な背景を通過する必要があります。
深層強化学習に基づく既存の衝突回避ナビゲーション手法は、有望なパフォーマンスを示しますが、汎化能力が低く、目に見えない環境ではパフォーマンスが低下します。
この問題に対処するために、我々は DRL の汎化能力が弱い原因を調査し、新しい因果特徴選択モジュールを提案します。
このモジュールはポリシー ネットワークに統合でき、表現内の非因果的要因を効果的にフィルタリングして除去することで、非因果的要因と行動予測の間の偽の相関の影響を軽減します。
実験結果は、私たちが提案した方法が、特に目に見えない背景や障害物があるシナリオで堅牢なナビゲーションパフォーマンスと効果的な衝突回避を達成できることを示しており、既存の最先端のアルゴリズムを大幅に上回ります。

要約(オリジナル)

In unseen and complex outdoor environments, collision avoidance navigation for unmanned aerial vehicle (UAV) swarms presents a challenging problem. It requires UAVs to navigate through various obstacles and complex backgrounds. Existing collision avoidance navigation methods based on deep reinforcement learning show promising performance but suffer from poor generalization abilities, resulting in performance degradation in unseen environments. To address this issue, we investigate the cause of weak generalization ability in DRL and propose a novel causal feature selection module. This module can be integrated into the policy network and effectively filters out non-causal factors in representations, thereby reducing the influence of spurious correlations between non-causal factors and action predictions. Experimental results demonstrate that our proposed method can achieve robust navigation performance and effective collision avoidance especially in scenarios with unseen backgrounds and obstacles, which significantly outperforms existing state-of-the-art algorithms.

arxiv情報

著者 Jiafan Zhuang,Gaofei Han,Zihao Xia,Boxi Wang,Wenji Li,Dongliang Wang,Zhifeng Hao,Ruichu Cai,Zhun Fan
発行日 2024-07-15 09:22:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク