Towards Efficient MPPI Trajectory Generation with Unscented Guidance: U-MPPI Control Strategy

要約

従来のモデル予測経路積分 (MPPI) 制御フレームワークは、多くのアプリケーションでは有効ですが、リスク中立の軌道評価技術に依存しているため、信頼性の高い安全機能が欠けており、自動運転などの安全性が重要なアプリケーションにとっては課題となる可能性があります。
さらに、MPPI でサンプリングされた軌跡の大部分が高コスト領域に集中すると、実行不可能な制御シーケンスが生成される可能性があります。
この課題に対処するために、私たちは、より効率的な軌道サンプリング戦略を統合しながら、システムの不確実性を効果的に管理できる新しい方法論である U-MPPI 制御戦略を提案します。
中心となるコンセプトは、Unscented Transform (UT) を活用して、従来の MPPI 手法を超えて、システム ダイナミクスの平均だけでなく共分散も伝播することです。
その結果、新しくより効率的な軌道サンプリング戦略が導入され、状態空間探索が大幅に強化され、最終的に極小値に閉じ込められるリスクが軽減されます。
さらに、UT が提供する不確実性情報を活用することで、軌道評価プロセス全体を通じてリスクや不確実性を明示的に考慮するリスクに敏感なコスト関数を組み込み、その結果、不確実な状況に対処できるより回復力の高い制御システムが実現します。
既知および未知の乱雑な環境の両方で 2D アグレッシブ自律ナビゲーションの広範なシミュレーションを実行することで、ベースライン MPPI と比較して、提案した U-MPPI 制御戦略の効率と堅牢性を検証します。
さらに、未知の乱雑な環境での実世界のデモンストレーションを通じて U-MPPI の実用性を検証し、追加の複雑さを導入することなく UT とローカル コストマップの両方を最適化問題に組み込む優れた能力を示します。

要約(オリジナル)

The classical Model Predictive Path Integral (MPPI) control framework, while effective in many applications, lacks reliable safety features due to its reliance on a risk-neutral trajectory evaluation technique, which can present challenges for safety-critical applications such as autonomous driving. Furthermore, when the majority of MPPI sampled trajectories concentrate in high-cost regions, it may generate an infeasible control sequence. To address this challenge, we propose the U-MPPI control strategy, a novel methodology that can effectively manage system uncertainties while integrating a more efficient trajectory sampling strategy. The core concept is to leverage the Unscented Transform (UT) to propagate not only the mean but also the covariance of the system dynamics, going beyond the traditional MPPI method. As a result, it introduces a novel and more efficient trajectory sampling strategy, significantly enhancing state-space exploration and ultimately reducing the risk of being trapped in local minima. Furthermore, by leveraging the uncertainty information provided by UT, we incorporate a risk-sensitive cost function that explicitly accounts for risk or uncertainty throughout the trajectory evaluation process, resulting in a more resilient control system capable of handling uncertain conditions. By conducting extensive simulations of 2D aggressive autonomous navigation in both known and unknown cluttered environments, we verify the efficiency and robustness of our proposed U-MPPI control strategy compared to the baseline MPPI. We further validate the practicality of U-MPPI through real-world demonstrations in unknown cluttered environments, showcasing its superior ability to incorporate both the UT and local costmap into the optimization problem without introducing additional complexity.

arxiv情報

著者 Ihab S. Mohamed,Junhong Xu,Gaurav S Sukhatme,Lantao Liu
発行日 2024-12-21 23:04:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク