Biased-MPPI: Informing Sampling-Based Model Predictive Control by Fusing Ancillary Controllers

要約

動的環境における自律ロボットの動作計画は、ロボットのダイナミクスの不確実性や他のエージェントとの相互作用のために、多くの課題を提起する。モデル予測経路積分(MPPI)制御のようなサンプリングベースのMPCアプローチは、このような複雑な運動計画問題に対処する上で有望である。しかし、MPPIの性能はサンプリング分布の選択に大きく依存します。既存の文献では、多くの場合、事前に計算された入力シーケンスをガウス分布の平均としてサンプリングに使用しており、潜在的な失敗や局所極小につながる。本論文では、局所極小の問題を緩和しつつ、効率性、ロバスト性、収束性を向上させるために、任意のサンプリング分布を可能にするMPPIの新しい導出を提案する。古典的制御と学習ベースの補助制御を同時に組み合わせ、より有益なサンプリングと制御融合をもたらす効率的な重要度サンプリング方式を提示する。いくつかのシミュレーションと実世界により、我々のアプローチの有効性を実証する。

要約(オリジナル)

Motion planning for autonomous robots in dynamic environments poses numerous challenges due to uncertainties in the robot’s dynamics and interaction with other agents. Sampling-based MPC approaches, such as Model Predictive Path Integral (MPPI) control, have shown promise in addressing these complex motion planning problems. However, the performance of MPPI relies heavily on the choice of sampling distribution. Existing literature often uses the previously computed input sequence as the mean of a Gaussian distribution for sampling, leading to potential failures and local minima. In this paper, we propose a novel derivation of MPPI that allows for arbitrary sampling distributions to enhance efficiency, robustness, and convergence while alleviating the problem of local minima. We present an efficient importance sampling scheme that combines classical and learning-based ancillary controllers simultaneously, resulting in more informative sampling and control fusion. Several simulated and real-world demonstrate the validity of our approach.

arxiv情報

著者 Elia Trevisan,Javier Alonso-Mora
発行日 2024-05-06 14:14:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク