Stein Variational Guided Model Predictive Path Integral Control: Proposal and Experiments with Fast Maneuvering Vehicles


この論文では、モデル予測経路積分制御 (MPPI) に基づく新しい確率的最適制御 (SOC) 手法、Stein variational Guided MPPI (SVG-MPPI) を紹介します。これは、急速に変化するマルチモーダル最適アクション分布を処理するように設計されています。
MPPI は、閉じた形式で、つまり反復的な解の更新を行わずに、ガウス近似された最適なアクション分布を見つけることができますが、障害物回避のための非凸制約が関与するものなど、最適分布の多峰性に苦労します。
この制限を克服するために、私たちの方法は、最適な分布のターゲット モードを特定し、それに適合するようにソリューションを収束させることを目的としています。
提案された方法では、修正されたスタイン変分勾配降下法 (SVGD) 法を使用してターゲット モードを大まかに推定し、MPPI アルゴリズムに埋め込んで、ターゲット モードのみをカバーする閉じた形式の「モード探索」ソリューションを見つけます。
MPPI の高速収束特性。
私たちのシミュレーションと実際の実験結果は、SVG-MPPI が、経路追跡機能と障害物回避機能の点で、オリジナルの MPPI やその他の最先端のサンプリング ベースの SOC アルゴリズムの両方よりも優れていることを示しています。


This paper presents a novel Stochastic Optimal Control (SOC) method based on Model Predictive Path Integral control (MPPI), named Stein Variational Guided MPPI (SVG-MPPI), designed to handle rapidly shifting multimodal optimal action distributions. While MPPI can find a Gaussian-approximated optimal action distribution in closed form, i.e., without iterative solution updates, it struggles with multimodality of the optimal distributions, such as those involving non-convex constraints for obstacle avoidance. This is due to the less representative nature of the Gaussian. To overcome this limitation, our method aims to identify a target mode of the optimal distribution and guide the solution to converge to fit it. In the proposed method, the target mode is roughly estimated using a modified Stein Variational Gradient Descent (SVGD) method and embedded into the MPPI algorithm to find a closed-form ‘mode-seeking’ solution that covers only the target mode, thus preserving the fast convergence property of MPPI. Our simulation and real-world experimental results demonstrate that SVG-MPPI outperforms both the original MPPI and other state-of-the-art sampling-based SOC algorithms in terms of path-tracking and obstacle-avoidance capabilities. Source code:


著者 Kohei Honda,Naoki Akai,Kosuke Suzuki,Mizuho Aoki,Hirotaka Hosogaya,Hiroyuki Okuda,Tatsuya Suzuki
発行日 2023-09-20 03:39:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.IT, cs.RO, math.IT パーマリンク