BR-MPPI: Barrier Rate guided MPPI for Enforcing Multiple Inequality Constraints with Learned Signed Distance Field

要約

モデル予測パス積分(MPPI)コントローラーは、制約のない最適制御問題を解決するために使用され、制御バリア関数(CBF)は、厳格な不等式制約を課すツールです。
この作業では、MPPIの制御サンプリング手順を導くためにCBF様条件を使用するこれら2つの方法の統合を提案します。
CBFは、バリア自体のクラスK関数によってバリア関数の変化率を制限する不平等制約を提供します。
代わりに、パラメトリック線形クラス関数を選択し、このパラメーターを増強されたシステムの状態として扱うことにより、CBF条件を等式制約として課します。
このパラメーターの時間導関数は、MPPIによって設計された追加の制御入力として機能します。
コスト関数は、安全性を強制するためにClassKパラメーターの特定の値を促進することにより、安全セットの境界でNagumoの定理を再燃させるように設計されています。
私たちの問題の定式化は、ランダムにサンプリングされた制御入力に満足するために自明でない複数の状態および制御依存の等式制約を受けるMPPIをもたらします。
したがって、前述の問題を解決するために、マニホールドのパス計画に関する文献に触発された状態変換および制御投影操作を導入します。
私たちの提案されたアルゴリズムは、バニラMPPIの安全なセット境界に近い動作を行うためのより良いサンプリング効率と強化された機能を示すことを、四つ丸のシミュレーションと実験を通じて経験的に示します。

要約(オリジナル)

Model Predictive Path Integral (MPPI) controller is used to solve unconstrained optimal control problems and Control Barrier Function (CBF) is a tool to impose strict inequality constraints, a.k.a, barrier constraints. In this work, we propose an integration of these two methods that employ CBF-like conditions to guide the control sampling procedure of MPPI. CBFs provide an inequality constraint restricting the rate of change of barrier functions by a classK function of the barrier itself. We instead impose the CBF condition as an equality constraint by choosing a parametric linear classK function and treating this parameter as a state in an augmented system. The time derivative of this parameter acts as an additional control input that is designed by MPPI. A cost function is further designed to reignite Nagumo’s theorem at the boundary of the safe set by promoting specific values of classK parameter to enforce safety. Our problem formulation results in an MPPI subject to multiple state and control-dependent equality constraints which are non-trivial to satisfy with randomly sampled control inputs. We therefore also introduce state transformations and control projection operations, inspired by the literature on path planning for manifolds, to resolve the aforementioned issue. We show empirically through simulations and experiments on quadrotor that our proposed algorithm exhibits better sampled efficiency and enhanced capability to operate closer to the safe set boundary over vanilla MPPI.

arxiv情報

著者 Hardik Parwana,Taekyung Kim,Kehan Long,Bardh Hoxha,Hideki Okamoto,Georgios Fainekos,Dimitra Panagou
発行日 2025-06-08 23:45:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC パーマリンク