要約
人が住む環境における自律ロボットの動作計画は、ロボットのダイナミクス、環境、および他のエージェントとの相互作用における不確実性により、多くの課題を引き起こします。
モデル予測経路積分 (MPPI) 制御などのサンプリング ベースの MPC アプローチは、これらの複雑な動作計画の問題の解決に有望であることが示されています。
ただし、MPPI のパフォーマンスはサンプリング分布の選択に大きく依存します。
既存の文献では、以前に計算された入力シーケンスをサンプリングのガウス分布の平均として使用することが多く、潜在的な失敗や極小値が発生する可能性があります。
この論文では、MPPI 法の効率、ロバスト性、および収束性を向上させるための MPPI 法の新しい派生を提案します。
私たちのアプローチには、任意のサンプリング分布を可能にし、数値的問題に対処し、極小値の問題を軽減する数学的定式化が含まれています。
古典的なコントローラと学習ベースの補助コントローラを同時に組み合わせ、より有益なサンプリングと制御の融合をもたらす、効率的な重要度サンプリング スキームを提案します。
モデルの不確実性、急速な環境変化を処理し、極小値に対する感受性を低減することにより、提案したスキームの優れた効率とロバスト性を実験を通じて実証します。
要約(オリジナル)
Motion planning for autonomous robots in human-populated environments poses numerous challenges due to uncertainties in the robot’s dynamics, environment, and interaction with other agents. Sampling-based MPC approaches, such as Model Predictive Path Integral (MPPI) control, have shown promise in addressing these complex motion planning problems. However, the performance of MPPI heavily relies on the choice of the sampling distribution. Existing literature often uses the previously computed input sequence as the mean of a Gaussian distribution for sampling, leading to potential failures and local minima. In this paper, we propose novel derivations of the MPPI method to enhance its efficiency, robustness, and convergence. Our approach includes a mathematical formulation allowing for arbitrary sampling distributions, addressing numerical issues, and alleviating the problem of local minima. We present an efficient importance sampling scheme that combines classical and learning-based ancillary controllers simultaneously, resulting in more informative sampling and control fusion. We demonstrate our proposed scheme’s superior efficiency and robustness through experiments by handling model uncertainties, rapid environmental changes and reducing susceptibility to local minima.
arxiv情報
著者 | Elia Trevisan,Javier Alonso-Mora |
発行日 | 2024-01-17 14:43:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google