Imitation Learning-Based Online Time-Optimal Control with Multiple-Waypoint Constraints for Quadrotors

要約

過去 10 年間で、クワッドローターはそのシンプルな構造と積極的な操縦性により、捜索救助、配送、自律ドローンレースなど、さまざまな目的で利用することが目覚ましい勢いで行われてきました。これがクアッドローターの普及を妨げている重要な課題の 1 つです。
これらのシナリオで使用されるのは、オンラインのウェイポイントに制約された時間最適軌道の生成および制御技術です。
このレターでは、最適な時間パフォーマンスで複数のウェイポイントを通過してクワッドローターを効率的にナビゲートするための、模倣学習ベースのオンライン ソリューションを提案します。
ニューラル ネットワーク (WN&CNets) は、時間のかかる CPC アルゴリズムによって生成されたデータセットから制御法則を学習するようにトレーニングされ、クアッドローターを誘導する最適な制御コマンドをオンラインで生成するために展開されます。
限られたトレーニング データと最終ウェイポイントでのホバリング操縦という課題に対処するために、MINCO 軌道を利用して、ウェイポイントを切り替えるときにクワッドローターがストップ アンド ゴー操縦を「ジャンプ」できるようにする移行フェーズ戦略を提案します。
私たちの方法はシミュレーションと現実世界の実験の両方で実証され、5.5m*5.5m*2.0mの限られた空間内で7つのウェイポイントを通過しながら最大速度5.6m/sを達成しました。
結果は、最適性がわずかに失われるものの、WN&CNets は処理時間を大幅に短縮し、複数のウェイポイントに制約された飛行タスクのオンライン最適制御を可能にすることを示しています。

要約(オリジナル)

Over the past decade, there has been a remarkable surge in utilizing quadrotors for various purposes due to their simple structure and aggressive maneuverability, such as search and rescue, delivery and autonomous drone racing, etc. One of the key challenges preventing quadrotors from being widely used in these scenarios is online waypoint-constrained time-optimal trajectory generation and control technique. This letter proposes an imitation learning-based online solution to efficiently navigate the quadrotor through multiple waypoints with time-optimal performance. The neural networks (WN&CNets) are trained to learn the control law from the dataset generated by the time-consuming CPC algorithm and then deployed to generate the optimal control commands online to guide the quadrotors. To address the challenge of limited training data and the hover maneuver at the final waypoint, we propose a transition phase strategy that utilizes MINCO trajectories to help the quadrotor ‘jump over’ the stop-and-go maneuver when switching waypoints. Our method is demonstrated in both simulation and real-world experiments, achieving a maximum speed of 5.6m/s while navigating through 7 waypoints in a confined space of 5.5m*5.5m*2.0m. The results show that with a slight loss in optimality, the WN&CNets significantly reduce the processing time and enable online optimal control for multiple-waypoint constrained flight tasks.

arxiv情報

著者 Jin Zhou,Jiahao Mei,Fangguo Zhao,Jiming Chen,Shuo Li
発行日 2024-09-10 07:49:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク