要約
この論文では、ロボット システムのポリシーベースの動作計画について説明します。
動作計画の文献は主に、オンラインで追跡する開ループ軌道計画に焦点を当ててきました。
対照的に、関連するフィードバック制御問題を解決することにより、経路計画とコントローラー合成の問題を同時に解決します。
我々は、動作計画のための新しい増分ポリシー (iPolicy) アルゴリズムを提案します。このアルゴリズムは、ロボット システムのフィードバック コントローラーを計算するために、サンプリング ベースの手法と設定値の最適制御手法を統合します。
特に、サンプリングを使用してシステムの状態空間を段階的に構築します。
非同期値の反復がサンプリングされた状態空間で実行され、増分ポリシー フィードバック コントローラーが合成されます。
連続状態空間における最適値関数への推定値の収束を示します。
さまざまな動的システム (非ホロノミック システムを含む) を使用した数値結果により、iPolicy の最適性と有効性が検証されます。
要約(オリジナル)
This paper presents policy-based motion planning for robotic systems. The motion planning literature has been mostly focused on open-loop trajectory planning which is followed by tracking online. In contrast, we solve the problem of path planning and controller synthesis simultaneously by solving the related feedback control problem. We present a novel incremental policy (iPolicy) algorithm for motion planning, which integrates sampling-based methods and set-valued optimal control methods to compute feedback controllers for the robotic system. In particular, we use sampling to incrementally construct the state space of the system. Asynchronous value iterations are performed on the sampled state space to synthesize the incremental policy feedback controller. We show the convergence of the estimates to the optimal value function in continuous state space. Numerical results with various different dynamical systems (including nonholonomic systems) verify the optimality and effectiveness of iPolicy.
arxiv情報
著者 | Guoxiang Zhao,Devesh K. Jha,Yebin Wang,Minghui Zhu |
発行日 | 2024-01-05 16:25:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google