Time-Optimal Flight with Safety Constraints and Data-driven Dynamics

要約

最適な時間でクワッドローター飛行を行うことは、取り扱いの限界で制御権限が制限されるため、非常に困難な問題です。
モデル予測輪郭制御 (MPCC) は、ドローン レースなどの時間最適化問題に対する主要なモデルベースのアプローチとして登場しました。
ただし、クワッドローター レースで使用される標準の MPCC 定式化では、コスト関数にゲートの概念が直接導入され、進行状況の最大化と正確な経路追跡の間で継続的にトレードオフを行う多目的の最適化が作成されます。
このペーパーでは、ドローン レース向けの MPCC アプローチを強化する 3 つの主要なコンポーネントを紹介します。
何よりもまず、制約と端子セットの形式で安全性を保証します。
安全セットは、コスト関数でのみ時間の最適化を可能にしながら、ゲートの衝突を防止する空間的制約として設計されています。
次に、実世界のデータから直接学習した複雑な空力効果と推力を捉える残差項を使用して、既存の第一原理ダイナミクスを強化します。
3 番目に、最先端のグローバル ベイジアン最適化アルゴリズムである Trust Regional Bayesian Optimization (TuRBO) を使用して、ラップタイムの最小化に基づいたスパース報酬が与えられた MPC コントローラーのハイパーパラメーターを調整します。
提案されたアプローチは、制約を満たしながら、最高の最先端 RL と同様のラップタイムを達成し、最高の時間最適コントローラーを上回ります。
シミュレーションと現実世界の両方で、私たちのアプローチは一貫して 100% の成功率でゲート クラッシュを防止しながら、クアッドローターを物理的限界まで押し上げ、80 km/h 以上の速度に達します。

要約(オリジナル)

Time-optimal quadrotor flight is an extremely challenging problem due to the limited control authority encountered at the limit of handling. Model Predictive Contouring Control (MPCC) has emerged as a leading model-based approach for time optimization problems such as drone racing. However, the standard MPCC formulation used in quadrotor racing introduces the notion of the gates directly in the cost function, creating a multi-objective optimization that continuously trades off between maximizing progress and tracking the path accurately. This paper introduces three key components that enhance the MPCC approach for drone racing. First and foremost, we provide safety guarantees in the form of a constraint and terminal set. The safety set is designed as a spatial constraint which prevents gate collisions while allowing for time-optimization only in the cost function. Second, we augment the existing first principles dynamics with a residual term that captures complex aerodynamic effects and thrust forces learned directly from real world data. Third, we use Trust Region Bayesian Optimization (TuRBO), a state of the art global Bayesian Optimization algorithm, to tune the hyperparameters of the MPC controller given a sparse reward based on lap time minimization. The proposed approach achieves similar lap times to the best state-of-the-art RL and outperforms the best time-optimal controller while satisfying constraints. In both simulation and real-world, our approach consistently prevents gate crashes with 100\% success rate, while pushing the quadrotor to its physical limit reaching speeds of more than 80km/h.

arxiv情報

著者 Maria Krinner,Angel Romero,Leonard Bauersfeld,Melanie Zeilinger,Andrea Carron,Davide Scaramuzza
発行日 2024-03-26 09:58:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク