Spline-Interpolated Model Predictive Path Integral Control with Stein Variational Inference for Reactive Navigation

要約

この論文では、制御入力シーケンスのスプライン補間とスタイン変分勾配降下法 (SVGD) で強化されたモデル予測経路積分 (MPPI) 制御を利用するリアクティブ ナビゲーション手法を紹介します。
MPPI フレームワークは、サンプリング ベースのアプローチを通じて制御入力の最適なシーケンスを決定することにより、非線形最適化問題に対処します。
MPPI の有効性はサンプリング ノイズに大きく影響されます。
大きな障害物や新たに検出された障害物を回避するルートを迅速に特定するには、高レベルのサンプリング ノイズを使用することが不可欠です。
ただし、このような高いノイズ レベルでは制御入力シーケンスがぎくしゃくし、滑らかではない軌道が発生します。
この問題を軽減するために、MPPI プロセス内にスプライン補間を統合することを提案します。これにより、大量のサンプリング ノイズを使用しているにもかかわらず、スムーズな制御入力シーケンスの生成が可能になります。
それにもかかわらず、標準の MPPI アルゴリズムは、最適な制御入力シーケンスにわたる分布はガウス分布で近似できると仮定しているため、複数の最適なソリューションまたは最適に近いソリューションを特徴とするシナリオ (実行可能な障害物回避パスが複数ある環境など) では困難を伴います。
この制限に対処するために、スプライン補間を使用して SVGD を MPPI フレームワークに組み込むことで方法を拡張します。
最適輸送アルゴリズムに根ざした SVGD は、最適なソリューションを中心にサンプルをクラスター化する独自の機能を備えています。
その結果、私たちのアプローチは、制御入力シーケンスの滑らかさを維持しながら、障害物回避経路を迅速に特定することにより、堅牢な反応型ナビゲーションを促進します。
私たちが提案した方法の有効性はクアローターを使用したシミュレーションで検証され、既存のベースライン技術よりも優れたパフォーマンスを示しています。

要約(オリジナル)

This paper presents a reactive navigation method that leverages a Model Predictive Path Integral (MPPI) control enhanced with spline interpolation for the control input sequence and Stein Variational Gradient Descent (SVGD). The MPPI framework addresses a nonlinear optimization problem by determining an optimal sequence of control inputs through a sampling-based approach. The efficacy of MPPI is significantly influenced by the sampling noise. To rapidly identify routes that circumvent large and/or newly detected obstacles, it is essential to employ high levels of sampling noise. However, such high noise levels result in jerky control input sequences, leading to non-smooth trajectories. To mitigate this issue, we propose the integration of spline interpolation within the MPPI process, enabling the generation of smooth control input sequences despite the utilization of substantial sampling noises. Nonetheless, the standard MPPI algorithm struggles in scenarios featuring multiple optimal or near-optimal solutions, such as environments with several viable obstacle avoidance paths, due to its assumption that the distribution over an optimal control input sequence can be closely approximated by a Gaussian distribution. To address this limitation, we extend our method by incorporating SVGD into the MPPI framework with spline interpolation. SVGD, rooted in the optimal transportation algorithm, possesses the unique ability to cluster samples around an optimal solution. Consequently, our approach facilitates robust reactive navigation by swiftly identifying obstacle avoidance paths while maintaining the smoothness of the control input sequences. The efficacy of our proposed method is validated on simulations with a quadrotor, demonstrating superior performance over existing baseline techniques.

arxiv情報

著者 Takato Miura,Naoki Akai,Kohei Honda,Susumu Hara
発行日 2024-04-16 08:53:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク