iPolicy: Incremental Policy Algorithms for Feedback Motion Planning


この論文では、ロボット システムのポリシーベースの動作計画について説明します。
我々は、動作計画のための新しい増分ポリシー (iPolicy) アルゴリズムを提案します。このアルゴリズムは、ロボット システムのフィードバック コントローラーを計算するために、サンプリング ベースの手法と設定値の最適制御手法を統合します。
非同期値の反復がサンプリングされた状態空間で実行され、増分ポリシー フィードバック コントローラーが合成されます。
さまざまな動的システム (非ホロノミック システムを含む) を使用した数値結果により、iPolicy の最適性と有効性が検証されます。


This paper presents policy-based motion planning for robotic systems. The motion planning literature has been mostly focused on open-loop trajectory planning which is followed by tracking online. In contrast, we solve the problem of path planning and controller synthesis simultaneously by solving the related feedback control problem. We present a novel incremental policy (iPolicy) algorithm for motion planning, which integrates sampling-based methods and set-valued optimal control methods to compute feedback controllers for the robotic system. In particular, we use sampling to incrementally construct the state space of the system. Asynchronous value iterations are performed on the sampled state space to synthesize the incremental policy feedback controller. We show the convergence of the estimates to the optimal value function in continuous state space. Numerical results with various different dynamical systems (including nonholonomic systems) verify the optimality and effectiveness of iPolicy.


著者 Guoxiang Zhao,Devesh K. Jha,Yebin Wang,Minghui Zhu
発行日 2024-01-05 16:25:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク