Smooth Model Predictive Path Integral Control without Smoothing

要約

外部平滑化アルゴリズムを使用せずに、一般的な非線形システムに対して滑らかな動作を生成できるサンプリングベースの制御アプローチを提案します。
モデル予測経路積分 (MPPI) 制御は、非凸最適化問題を解決する魅力的な特性により、多くのロボット アプリケーションで利用されています。
ただし、サンプリングベースのメソッドの確率的な性質により、結果として得られるコマンドに重大なチャタリングが発生する可能性があります。
環境が急激に変化する場合にはチャタリングがより顕著になり、MPPI が発散する可能性もあります。
この問題に対処するために、MPPI と入力リフティング戦略をシームレスに組み合わせる方法を提案します。
さらに、非アフィン ダイナミクスから導出された MPPI の情報理論的解釈を維持しながら、軌道ロールアウト中の制御シーケンスをスムーズにするための新しいアクション コストを導入します。
ニューラル ネットワーク ダイナミクスを使用した 2 つの非線形制御タスク、つまり振り子のスイングアップ タスクと挑戦的な自動運転タスクでメソッドを検証します。
実験結果は、平滑化アルゴリズムを追加適用した場合、私たちの方法が MPPI ベースラインよりも優れていることを示しています。

要約(オリジナル)

We present a sampling-based control approach that can generate smooth actions for general nonlinear systems without external smoothing algorithms. Model Predictive Path Integral (MPPI) control has been utilized in numerous robotic applications due to its appealing characteristics to solve non-convex optimization problems. However, the stochastic nature of sampling-based methods can cause significant chattering in the resulting commands. Chattering becomes more prominent in cases where the environment changes rapidly, possibly even causing the MPPI to diverge. To address this issue, we propose a method that seamlessly combines MPPI with an input-lifting strategy. In addition, we introduce a new action cost to smooth control sequence during trajectory rollouts while preserving the information theoretic interpretation of MPPI, which was derived from non-affine dynamics. We validate our method in two nonlinear control tasks with neural network dynamics: a pendulum swing-up task and a challenging autonomous driving task. The experimental results demonstrate that our method outperforms the MPPI baselines with additionally applied smoothing algorithms.

arxiv情報

著者 Taekyung Kim,Gyuhyun Park,Kiho Kwak,Jihwan Bae,Wonsuk Lee
発行日 2024-08-08 07:04:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク