MPCC++: Model Predictive Contouring Control for Time-Optimal Flight with Safety Constraints

要約

クアッドローター飛行は、取り扱いの限界に達すると制御権限が制限されるため、非常に困難な問題です。
モデル予測輪郭制御 (MPCC) は、ドローン レースなどの時間最適化問題に対する有望なモデルベースのアプローチとして浮上しています。
ただし、クアッドローター レーシングで使用される標準 MPCC 定式化では、コスト関数にゲートの概念が直接導入され、進行状況の最大化と正確な経路の追跡の間で継続的にトレードオフを行う多目的の最適化が作成されます。
このペーパーでは、ドローン レース向けの最先端の MPCC アプローチを強化する 3 つの主要なコンポーネントを紹介します。
何よりもまず、線路制約と端子セットの形で安全性を保証します。
トラック制約は、コスト関数でのみ時間の最適化を可能にしながら、ゲートの衝突を防止する空間制約として設計されています。
次に、実世界のデータから直接学習した複雑な空力効果と推力を捉える残差項を使用して、既存の第一原理ダイナミクスを強化します。
3 番目に、最先端のグローバル ベイジアン最適化アルゴリズムである Trust Regional Bayesian Optimization (TuRBO) を使用して、ラップタイムの最小化に基づいたスパース報酬が与えられた MPCC コントローラーのハイパーパラメーターを調整します。
提案されたアプローチは、制約を満たしながら、最もパフォーマンスの高い RL ポリシーと同様のラップタイムを達成し、最も優れたモデルベースのコントローラーを上回ります。
シミュレーションと現実世界の両方で、私たちのアプローチは一貫して 100% の成功率でゲートの衝突を防止しながら、クアッドローターを物理的限界まで押し上げ、時速 80 km 以上の速度に達します。

要約(オリジナル)

Quadrotor flight is an extremely challenging problem due to the limited control authority encountered at the limit of handling. Model Predictive Contouring Control (MPCC) has emerged as a promising model-based approach for time optimization problems such as drone racing. However, the standard MPCC formulation used in quadrotor racing introduces the notion of the gates directly in the cost function, creating a multi objective optimization that continuously trades off between maximizing progress and tracking the path accurately. This paper introduces three key components that enhance the state-of-the-art MPCC approach for drone racing. First and foremost, we provide safety guarantees in the form of a track constraint and terminal set. The track constraint is designed as a spatial constraint which prevents gate collisions while allowing for time optimization only in the cost function. Second, we augment the existing first principles dynamics with a residual term that captures complex aerodynamic effects and thrust forces learned directly from real-world data. Third, we use Trust Region Bayesian Optimization (TuRBO), a state-of-the-art global Bayesian Optimization algorithm, to tune the hyperparameters of the MPCC controller given a sparse reward based on lap time minimization. The proposed approach achieves similar lap times to the best-performing RL policy and outperforms the best model-based controller while satisfying constraints. In both simulation and real world, our approach consistently prevents gate crashes with 100% success rate, while pushing the quadrotor to its physical limits reaching speeds of more than 80km/h.

arxiv情報

著者 Maria Krinner,Angel Romero,Leonard Bauersfeld,Melanie Zeilinger,Andrea Carron,Davide Scaramuzza
発行日 2024-06-14 09:48:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク