DualGuard MPPI: Safe and Performant Optimal Control by Combining Sampling-Based MPC and Hamilton-Jacobi Reachability


安全性と性能を両立するコントローラを設計することは、本質的に困難である。この共最適化は、コスト関数が性能基準を表し、安全性が制約として指定される制約付き最適制御問題として定式化することができます。MPPI(Model Predictive Path Integral)制御のようなサンプリングベースの手法は、複雑な最適制御問題に取り組む上で大きな可能性を示しているが、安全性制約を強制するのに苦労することが多い。この限界に対処するため、我々は安全制約付き最適制御問題を解くための新しいフレームワークであるDualGuard-MPPIを提案する。我々のアプローチは、ハミルトン-ヤコビ到達可能性解析をMPPIサンプリングプロセスに統合し、生成される全てのサンプルがシステムにとって証明可能な安全性を持つことを保証する。一方では、この統合により、DualGuard-MPPIは厳密な安全制約を強制することができ、同時に、同じサンプル数でより効果的な環境の探索を容易にし、効果的なサンプリング分散を減少させ、より良い性能最適化につながる。いくつかのシミュレーションとハードウェア実験を通して、提案アプローチが安全性を損なうことなく、既存のMPPI手法と比較してはるかに高い性能を達成することを実証する。


Designing controllers that are both safe and performant is inherently challenging. This co-optimization can be formulated as a constrained optimal control problem, where the cost function represents the performance criterion and safety is specified as a constraint. While sampling-based methods, such as Model Predictive Path Integral (MPPI) control, have shown great promise in tackling complex optimal control problems, they often struggle to enforce safety constraints. To address this limitation, we propose DualGuard-MPPI, a novel framework for solving safety-constrained optimal control problems. Our approach integrates Hamilton-Jacobi reachability analysis within the MPPI sampling process to ensure that all generated samples are provably safe for the system. On the one hand, this integration allows DualGuard-MPPI to enforce strict safety constraints; at the same time, it facilitates a more effective exploration of the environment with the same number of samples, reducing the effective sampling variance and leading to better performance optimization. Through several simulations and hardware experiments, we demonstrate that the proposed approach achieves much higher performance compared to existing MPPI methods, without compromising safety.


著者 Javier Borquez,Luke Raus,Yusuf Umut Ciftci,Somil Bansal
発行日 2025-02-04 01:51:20+00:00
