Learning Speed Adaptation for Flight in Clutter

要約

動物は、自分の能力や観察する環境に合わせて動きの速度を適応させることを学びます。
モバイル ロボットは、タスクを効率的に達成するために攻撃性と安全性をトレードオフするこの能力も実証する必要があります。
この研究の目的は、これまで知られていない、部分的に観察可能な雑然とした環境において、飛行体に速度適応能力を与えることである。
我々は、速度制約を動的に設定するためのポリシーを包括的に学習する、モデルベースの軌道生成の確立された方法と試行錯誤の両方を利用する、階層的な学習および計画フレームワークを提案します。
技術的には、オンライン強化学習を使用して、展開可能なポリシーを取得します。
シミュレーションの統計結果は、飛行効率と安全性の観点から、一定速度制約ベースラインおよび代替方法と比べて、私たちの方法の利点を示しています。
特に、このポリシーは認識を認識して行動し、それが代替アプローチとは区別されます。
ポリシーをハードウェアに展開することで、これらの利点が現実世界にもたらされることを検証します。

要約(オリジナル)

Animals learn to adapt speed of their movements to their capabilities and the environment they observe. Mobile robots should also demonstrate this ability to trade-off aggressiveness and safety for efficiently accomplishing tasks. The aim of this work is to endow flight vehicles with the ability of speed adaptation in prior unknown and partially observable cluttered environments. We propose a hierarchical learning and planning framework where we utilize both well-established methods of model-based trajectory generation and trial-and-error that comprehensively learns a policy to dynamically configure the speed constraint. Technically, we use online reinforcement learning to obtain the deployable policy. The statistical results in simulation demonstrate the advantages of our method over the constant speed constraint baselines and an alternative method in terms of flight efficiency and safety. In particular, the policy behaves perception awareness, which distinguish it from alternative approaches. By deploying the policy to hardware, we verify that these advantages can be brought to the real world.

arxiv情報

著者 Guangyu Zhao,Tianyue Wu,Yeke Chen,Fei Gao
発行日 2024-07-10 11:57:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク