要約
クアッドローターの任意の軌道を正確に追跡することは、未知の非線形ダイナミクス、軌道の実現不可能性、および作動限界のため困難です。
これらの課題に取り組むために、現実世界で大きな外乱が存在する場合に、任意の潜在的に実行不可能な軌道を正確に追跡できる学習ベースのアプローチである Deep Adaptive Trajectory Tracking (DATT) を紹介します。
DATT は、強化学習を使用したシミュレーションでトレーニングされた、新しいフィードフォワード フィードバック適応制御構造に基づいて構築されています。
実際のハードウェアに展開すると、DATT は閉ループで L1 適応制御を使用する外乱推定器で強化され、微調整は必要ありません。
DATT は、ベースラインが完全に機能しない困難なシナリオを含む、非定常風力場における実行可能な滑らかな軌道と実行不可能な軌道の両方において、競合する適応型非線形コントローラーやモデル予測コントローラーを大幅に上回ります。
さらに、DATT は、適応非線形モデルの予測制御ベースラインの 1/4 未満である 3.2 ミリ秒未満の推論時間でオンラインで効率的に実行できます。
要約(オリジナル)
Precise arbitrary trajectory tracking for quadrotors is challenging due to unknown nonlinear dynamics, trajectory infeasibility, and actuation limits. To tackle these challenges, we present Deep Adaptive Trajectory Tracking (DATT), a learning-based approach that can precisely track arbitrary, potentially infeasible trajectories in the presence of large disturbances in the real world. DATT builds on a novel feedforward-feedback-adaptive control structure trained in simulation using reinforcement learning. When deployed on real hardware, DATT is augmented with a disturbance estimator using L1 adaptive control in closed-loop, without any fine-tuning. DATT significantly outperforms competitive adaptive nonlinear and model predictive controllers for both feasible smooth and infeasible trajectories in unsteady wind fields, including challenging scenarios where baselines completely fail. Moreover, DATT can efficiently run online with an inference time less than 3.2 ms, less than 1/4 of the adaptive nonlinear model predictive control baseline
arxiv情報
著者 | Kevin Huang,Rwik Rana,Alexander Spitzer,Guanya Shi,Byron Boots |
発行日 | 2023-10-13 12:22:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google