Stein Variational Guided Model Predictive Path Integral Control: Proposal and Experiments with Fast Maneuvering Vehicles

要約

この論文では、モデル予測経路積分制御 (MPPI) に基づく新しい確率的最適制御 (SOC) 手法、Stein variational Guided MPPI (SVG-MPPI) を紹介します。これは、急速に変化するマルチモーダル最適アクション分布を処理するように設計されています。
MPPI は、閉じた形式で、つまり反復的な解の更新を行わずに、ガウス近似された最適なアクション分布を見つけることができますが、最適な分布の多峰性に問題を抱えています。
これは、ガウス分布の代表性が低いためです。
この制限を克服するために、私たちの方法は、最適な分布のターゲット モードを特定し、それに適合するようにソリューションを収束させることを目的としています。
提案された方法では、修正スタイン変分勾配降下法 (SVGD) 法を使用してターゲット モードを大まかに推定し、MPPI アルゴリズムに埋め込んで、ターゲット モードのみをカバーする閉形式の「モード探索」解を見つけます。
MPPI の高速収束特性を維持します。
私たちのシミュレーションと実際の実験結果は、SVG-MPPI が、経路追跡機能と障害物回避機能の点で、オリジナルの MPPI やその他の最先端のサンプリング ベースの SOC アルゴリズムの両方よりも優れていることを示しています。
ソースコード: https://github.com/kohonda/proj-svg_mppi

要約(オリジナル)

This paper presents a novel Stochastic Optimal Control (SOC) method based on Model Predictive Path Integral control (MPPI), named Stein Variational Guided MPPI (SVG-MPPI), designed to handle rapidly shifting multimodal optimal action distributions. While MPPI can find a Gaussian-approximated optimal action distribution in closed form, i.e., without iterative solution updates, it struggles with the multimodality of the optimal distributions. This is due to the less representative nature of the Gaussian. To overcome this limitation, our method aims to identify a target mode of the optimal distribution and guide the solution to converge to fit it. In the proposed method, the target mode is roughly estimated using a modified Stein Variational Gradient Descent (SVGD) method and embedded into the MPPI algorithm to find a closed-form “mode-seeking” solution that covers only the target mode, thus preserving the fast convergence property of MPPI. Our simulation and real-world experimental results demonstrate that SVG-MPPI outperforms both the original MPPI and other state-of-the-art sampling-based SOC algorithms in terms of path-tracking and obstacle-avoidance capabilities. Source code: https://github.com/kohonda/proj-svg_mppi

arxiv情報

著者 Kohei Honda,Naoki Akai,Kosuke Suzuki,Mizuho Aoki,Hirotaka Hosogaya,Hiroyuki Okuda,Tatsuya Suzuki
発行日 2024-02-15 01:53:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.RO, math.IT パーマリンク