Stochastic Motion Planning as Gaussian Variational Inference: Theory and Algorithms

要約

不確実性の下での運動計画問題を考慮し、確率的推論を使用してそれに対処します。
線形確率力学による衝突のない運動計画は、事後分布によってモデル化されます。
ガウス変分推論は、ガウス分布の範囲内で事後推定を行うためのパス分布の最適化です。
このガウス推論を解決するために、ガウス変分推論モーション プランナー (GVI-MP) アルゴリズムを提案します。このアルゴリズムでは、自然勾配パラダイムを使用してガウス分布を反復更新し、結合分布の因数分解構造が活用されます。
GVI-MP における状態分布に対する直接的な最適化は、閉形式の解を持つ確率的制御を解くことと同等であることを示します。
この観察から出発して、終端制約を伴う確率的制御形式で同じ推論問題を解決するために、2 番目のアルゴリズムである近接勾配共分散ステアリング モーション プランナー (PGCS-MP) を提案します。
近位勾配パラダイムを使用して、非線形衝突コストを伴う線形確率制御を解決します。非線形コストは二次関数を使用して反復的に近似され、反復ごとに線形共分散ステアリングを解くことで閉形式の解を取得できます。
私たちは、さまざまなロボットモデルでの広範な実験を通じて、提案されたアプローチの有効性とパフォーマンスを評価します。
この論文のコードは https://github.com/hzyu17/VIMP にあります。

要約(オリジナル)

We consider the motion planning problem under uncertainty and address it using probabilistic inference. A collision-free motion plan with linear stochastic dynamics is modeled by a posterior distribution. Gaussian variational inference is an optimization over the path distributions to infer this posterior within the scope of Gaussian distributions. We propose Gaussian Variational Inference Motion Planner (GVI-MP) algorithm to solve this Gaussian inference, where a natural gradient paradigm is used to iteratively update the Gaussian distribution, and the factorized structure of the joint distribution is leveraged. We show that the direct optimization over the state distributions in GVI-MP is equivalent to solving a stochastic control that has a closed-form solution. Starting from this observation, we propose our second algorithm, Proximal Gradient Covariance Steering Motion Planner (PGCS-MP), to solve the same inference problem in its stochastic control form with terminal constraints. We use a proximal gradient paradigm to solve the linear stochastic control with nonlinear collision cost, where the nonlinear cost is iteratively approximated using quadratic functions and a closed-form solution can be obtained by solving a linear covariance steering at each iteration. We evaluate the effectiveness and the performance of the proposed approaches through extensive experiments on various robot models. The code for this paper can be found in https://github.com/hzyu17/VIMP.

arxiv情報

著者 Hongzhe Yu,Yongxin Chen
発行日 2023-08-29 02:31:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク