A Unified Perspective on Multiple Shooting In Differential Dynamic Programming


微分動的計画法 (DDP) は、非線形最適制御問題を解決するための効率的な計算ツールです。
この研究では、DDP の複数射撃 (MS) への拡張を検討し、初期推測に対する堅牢性を向上させています。
局所的に二次収束を維持しながら、DDP 逆方向パス中の撮影セグメント間の欠陥を説明する新しい導出が提案されます。
この導出により、以前の複数の MS アルゴリズムを統合できるようになり、多くの小規模なアルゴリズムの改善への扉が開かれます。
ステップ サイズを戦略的に制御するためにペナルティ手法が導入され、収束パフォーマンスがさらに向上します。
MS-DDP は、四足ロボットによる動的ジャンプのためのモデル予測制御 (MPC) での使用についても実証されており、単一の射撃アプローチよりもメリットがあることが示されています。


Differential Dynamic Programming (DDP) is an efficient computational tool for solving nonlinear optimal control problems. It was originally designed as a single shooting method and thus is sensitive to the initial guess supplied. This work considers the extension of DDP to multiple shooting (MS), improving its robustness to initial guesses. A novel derivation is proposed that accounts for the defect between shooting segments during the DDP backward pass, while still maintaining quadratic convergence locally. The derivation enables unifying multiple previous MS algorithms, and opens the door to many smaller algorithmic improvements. A penalty method is introduced to strategically control the step size, further improving the convergence performance. An adaptive merit function and a more reliable acceptance condition are employed for globalization. The effects of these improvements are benchmarked for trajectory optimization with a quadrotor, an acrobot, and a manipulator. MS-DDP is also demonstrated for use in Model Predictive Control (MPC) for dynamic jumping with a quadruped robot, showing its benefits over a single shooting approach.


著者 He Li,Wenhao Yu,Tingnan Zhang,Patrick M. Wensing
発行日 2023-09-14 17:19:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク