Learning Agile Flights through Narrow Gaps with Varying Angles using Onboard Sensing

要約

この論文では、深層強化学習 (DRL) を使用して、クアッドローターの未知の傾斜した狭いギャップを通過する問題に対処します。
これまでの学習ベースの手法は、ギャップの姿勢やサイズなどの環境に関する正確な知識に依存していました。
対照的に、当社ではオンボードセンシングを統合し、単一のオンボードカメラからギャップを検出します。
トレーニング問題は 2 つの理由から困難です。1 つは、可変傾斜の狭いギャップに対して正確かつ堅牢な全身計画と制御ポリシーが必要であること、もう 1 つは実世界の実験を成功させるには効果的な Sim2Real 手法が必要であることです。
この目的を達成するために、我々は機敏なギャップ横断飛行のための学習フレームワークを提案します。このフレームワークは、積極的な傾斜角でギャップに対してほぼ同じ姿勢でギャップの中心を通過するように車両を訓練することに成功します。
シミュレーション環境のみでトレーニングされたポリシーは、成功率を維持しながら微調整しながら別のドメインに移行できます。
オンボードセンシングとニューラルネットワークコントローラーを統合した私たちの提案したフレームワークは、最大60度のギャップ方向での実世界の実験で84.51%の成功率を達成しました。
私たちの知る限り、これは、環境に関する事前知識なしで、学習ベースの可変傾斜狭ギャップ横断飛行を現実世界で実行した最初の論文です。

要約(オリジナル)

This paper addresses the problem of traversing through unknown, tilted, and narrow gaps for quadrotors using Deep Reinforcement Learning (DRL). Previous learning-based methods relied on accurate knowledge of the environment, including the gap’s pose and size. In contrast, we integrate onboard sensing and detect the gap from a single onboard camera. The training problem is challenging for two reasons: a precise and robust whole-body planning and control policy is required for variable-tilted and narrow gaps, and an effective Sim2Real method is needed to successfully conduct real-world experiments. To this end, we propose a learning framework for agile gap traversal flight, which successfully trains the vehicle to traverse through the center of the gap at an approximate attitude to the gap with aggressive tilted angles. The policy trained only in a simulation environment can be transferred into different domains with fine-tuning while maintaining the success rate. Our proposed framework, which integrates onboard sensing and a neural network controller, achieves a success rate of 84.51% in real-world experiments, with gap orientations up to 60deg. To the best of our knowledge, this is the first paper that performs the learning-based variable-tilted narrow gap traversal flight in the real world, without prior knowledge of the environment.

arxiv情報

著者 Yuhan Xie,Minghao Lu,Rui Peng,Peng Lu
発行日 2023-06-30 07:07:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク