Learning Agility Adaptation for Flight in Clutter

要約

動物は、自分たちの動作の機敏性を、自分の能力や活動する環境に適応させることを学びます。移動ロボットも、機敏性と安全性を組み合わせるこの能力を実証する必要があります。
この研究の目的は、これまで知られていない、部分的に観察可能な乱雑な環境において飛行体に機敏に適応する能力を与えることである。
私たちは、入力として車両の観察とモデルベースの軌道生成の確立された方法を使用して、敏捷性ポリシーを包括的に学習するために試行錯誤の両方を活用する、階層的な学習および計画フレームワークを提案します。
技術的には、オンラインのモデルフリー強化学習と事前トレーニング微調整報酬スキームを使用して、展開可能なポリシーを取得します。
シミュレーションの統計結果は、飛行効率と安全性の点で、一定の敏捷性ベースラインおよび代替方法と比べて、私たちの方法の利点を示しています。
特に、このポリシーは、他のアプローチとは異なる、知覚認識などのインテリジェントな行動につながります。
ポリシーをハードウェアに展開することで、これらの利点が現実世界にもたらされることを検証します。

要約(オリジナル)

Animals learn to adapt agility of their movements to their capabilities and the environment they operate in. Mobile robots should also demonstrate this ability to combine agility and safety. The aim of this work is to endow flight vehicles with the ability of agility adaptation in prior unknown and partially observable cluttered environments. We propose a hierarchical learning and planning framework where we utilize both trial and error to comprehensively learn an agility policy with the vehicle’s observation as the input, and well-established methods of model-based trajectory generation. Technically, we use online model-free reinforcement learning and a pre-training-fine-tuning reward scheme to obtain the deployable policy. The statistical results in simulation demonstrate the advantages of our method over the constant agility baselines and an alternative method in terms of flight efficiency and safety. In particular, the policy leads to intelligent behaviors, such as perception awareness, which distinguish it from other approaches. By deploying the policy to hardware, we verify that these advantages can be brought to the real world.

arxiv情報

著者 Guangyu Zhao,Tianyue Wu,Yeke Chen,Fei Gao
発行日 2024-03-07 15:30:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク