要約
この論文では、確率的最適制御と軌道最適化のための経路積分 (PI) 制御アプローチのチュートリアルの概要を示します。
確率的最適制御の解を計算するためのパス積分制御の理論的開発を簡潔に要約し、モデル予測パス積分として知られる後退地平線スキームを使用した開ループ コントローラーであるクロス エントロピー (CE) 法のアルゴリズムの説明を提供します (
MPPI)、およびパス積分制御理論に基づくパラメータ化された状態フィードバック コントローラーです。
パス積分制御に基づくポリシー検索手法、効率的で安定したサンプリング戦略、マルチエージェント意思決定の拡張、多様体上の軌道最適化のための MPPI について説明します。
チュートリアルのデモンストレーションでは、軌道の最適化のために、一部の PI ベースのコントローラーが MATLAB および ROS2/Gazebo シミュレーションに実装されています。
シミュレーション フレームワークとソース コードは、https://github.com/INHA-Autonomous-Systems-Laboratory-ASL/An-Overview-on-Recent-Advances-in-Path-Integral-Control で公開されています。
要約(オリジナル)
This paper presents a tutorial overview of path integral (PI) control approaches for stochastic optimal control and trajectory optimization. We concisely summarize the theoretical development of path integral control to compute a solution for stochastic optimal control and provide algorithmic descriptions of the cross-entropy (CE) method, an open-loop controller using the receding horizon scheme known as the model predictive path integral (MPPI), and a parameterized state feedback controller based on the path integral control theory. We discuss policy search methods based on path integral control, efficient and stable sampling strategies, extensions to multi-agent decision-making, and MPPI for the trajectory optimization on manifolds. For tutorial demonstrations, some PI-based controllers are implemented in MATLAB and ROS2/Gazebo simulations for trajectory optimization. The simulation frameworks and source codes are publicly available at https://github.com/INHA-Autonomous-Systems-Laboratory-ASL/An-Overview-on-Recent-Advances-in-Path-Integral-Control.
arxiv情報
著者 | Muhammad Kazim,JunGee Hong,Min-Gyeom Kim,Kwang-Ki K. Kim |
発行日 | 2023-09-22 01:34:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google