Learning Generalizable Policy for Obstacle-Aware Autonomous Drone Racing

要約

自律型ドローンレースは、ドローンナビゲーション技術の限界を押し広げる可能性があるとして注目を集めています。
既存の研究の多くは障害物のない環境でのレースに焦点を当てていますが、障害物を意識したレースの複雑さに取り組んだ研究はほとんどなく、これらの研究で提示されたアプローチは、学習されたポリシーが新しい環境にあまり一般化せず、過剰適合に悩まされることがよくあります。
この研究では、深層強化学習を使用して、一般化可能な障害物認識ドローン レース ポリシーを開発するという課題に取り組んでいます。
私たちは、目標を達成するために、毎回の展開前にレーシング トラックと障害物の構成にドメインのランダム化を適用し、ランダム化された環境での並行エクスペリエンスの収集と組み合わせることを提案します。
提案されたランダム化戦略は、ドローンが最高時速 70 km の速度に達し、目に見えない雑然とした環境でレースを行うシミュレーション実験を通じて効果的であることが示されています。
この研究は、障害物を認識したドローンレースや、雑然とした環境での汎用ドローンナビゲーションのための堅牢なポリシーを学ぶための足掛かりとなります。
コードは https://github.com/ErcBunny/IsaacGymEnvs で入手できます。

要約(オリジナル)

Autonomous drone racing has gained attention for its potential to push the boundaries of drone navigation technologies. While much of the existing research focuses on racing in obstacle-free environments, few studies have addressed the complexities of obstacle-aware racing, and approaches presented in these studies often suffer from overfitting, with learned policies generalizing poorly to new environments. This work addresses the challenge of developing a generalizable obstacle-aware drone racing policy using deep reinforcement learning. We propose applying domain randomization on racing tracks and obstacle configurations before every rollout, combined with parallel experience collection in randomized environments to achieve the goal. The proposed randomization strategy is shown to be effective through simulated experiments where drones reach speeds of up to 70 km/h, racing in unseen cluttered environments. This study serves as a stepping stone toward learning robust policies for obstacle-aware drone racing and general-purpose drone navigation in cluttered environments. Code is available at https://github.com/ErcBunny/IsaacGymEnvs.

arxiv情報

著者 Yueqian Liu
発行日 2024-11-06 20:25:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク