A Unified Perspective on Multiple Shooting In Differential Dynamic Programming

要約

微分動的計画法 (DDP) は、非線形最適制御問題を解決するための効率的な計算ツールです。
元々は単一の撮影方法として設計されたため、提供された最初の推測の影響を受けやすくなります。
この研究では、DDP の複数射撃 (MS) への拡張を検討し、初期推測に対する堅牢性を向上させています。
局所的に二次収束を維持しながら、DDP 逆方向パス中の撮影セグメント間の欠陥を説明する新しい導出が提案されます。
この導出により、以前の複数の MS アルゴリズムを統合できるようになり、多くの小規模なアルゴリズムの改善への扉が開かれます。
ステップ サイズを戦略的に制御するためにペナルティ手法が導入され、収束パフォーマンスがさらに向上します。
グローバリゼーションには、適応型メリット関数とより信頼性の高い受け入れ条件が採用されています。
これらの改善の効果は、クワッドローター、アクロロボット、およびマニピュレーターを使用した軌道最適化のベンチマークとなります。
MS-DDP は、四足ロボットによる動的ジャンプのためのモデル予測制御 (MPC) での使用についても実証されており、単一の射撃アプローチよりもメリットがあることが示されています。

要約(オリジナル)

Differential Dynamic Programming (DDP) is an efficient computational tool for solving nonlinear optimal control problems. It was originally designed as a single shooting method and thus is sensitive to the initial guess supplied. This work considers the extension of DDP to multiple shooting (MS), improving its robustness to initial guesses. A novel derivation is proposed that accounts for the defect between shooting segments during the DDP backward pass, while still maintaining quadratic convergence locally. The derivation enables unifying multiple previous MS algorithms, and opens the door to many smaller algorithmic improvements. A penalty method is introduced to strategically control the step size, further improving the convergence performance. An adaptive merit function and a more reliable acceptance condition are employed for globalization. The effects of these improvements are benchmarked for trajectory optimization with a quadrotor, an acrobot, and a manipulator. MS-DDP is also demonstrated for use in Model Predictive Control (MPC) for dynamic jumping with a quadruped robot, showing its benefits over a single shooting approach.

arxiv情報

著者 He Li,Wenhao Yu,Tingnan Zhang,Patrick M. Wensing
発行日 2023-09-14 17:19:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク