MAVRL: Learn to Fly in Cluttered Environments with Varying Speed

要約

既存の障害物回避アルゴリズムの多くは、特に複雑さが異なる環境において、安全性と俊敏性の間の重要なバランスを見落としています。
私たちの研究では、強化学習に基づく障害物回避パイプラインを導入します。
このパイプラインにより、ドローンは環境の複雑さに応じて飛行速度を調整できるようになります。
さらに、雑然とした環境における障害物回避性能を向上させるために、新たな潜在空間を提案します。
この表現の潜在空間は、以前の深度マップ観察の記憶を保持するように明示的にトレーニングされています。
私たちの調査結果は、速度を変化させることで、雑然とした環境において成功率と機敏性の優れたバランスにつながることが確認されました。
さらに、メモリ拡張潜在表現は、強化学習で一般的に使用される潜在表現よりも優れています。
最後に、最小限の微調整を経て、障害物回避を強化するために実際のドローンにネットワークを展開することに成功しました。

要約(オリジナル)

Many existing obstacle avoidance algorithms overlook the crucial balance between safety and agility, especially in environments of varying complexity. In our study, we introduce an obstacle avoidance pipeline based on reinforcement learning. This pipeline enables drones to adapt their flying speed according to the environmental complexity. Moreover, to improve the obstacle avoidance performance in cluttered environments, we propose a novel latent space. The latent space in this representation is explicitly trained to retain memory of previous depth map observations. Our findings confirm that varying speed leads to a superior balance of success rate and agility in cluttered environments. Additionally, our memory-augmented latent representation outperforms the latent representation commonly used in reinforcement learning. Finally, after minimal fine-tuning, we successfully deployed our network on a real drone for enhanced obstacle avoidance.

arxiv情報

著者 Hang Yu,Christophe De Wagter,Guido C. H. E de Croon
発行日 2024-02-13 11:22:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク