Constrained Trajectory Optimization on Matrix Lie Groups via Lie-Algebraic Differential Dynamic Programming

要約

行列リー群は制御やロボット工学で一般的に使用される重要な種類の多様体であり、これらの多様体に対する制御ポリシーを最適化することは基本的な問題です。
この研究では、拡張ラグランジュベースの制約付き離散微分動的計画法 (DDP) を使用して、行列リー群の軌道最適化のための新しい計算効率の高いアプローチを提案します。
この方法では、後方パス中に最適化問題をリー代数に持ち上げ、前方パス中に多様体に戻すことが含まれます。
行列リー群の特定のクラスのみに対する制約処理に対処していた以前のアプローチとは異なり、提案された方法は、汎用行列リー群全体にわたる非線形制約処理に対する一般的な解決策を提供します。
我々は、SE(3) の剛体ダイナミクスによって特徴付けられる機械システム内の制約を処理する際の提案された DDP 法の有効性を評価し、既存の直接最適化ソルバーと比較してその計算効率を評価します。
さらに、この方法は、SE(3) のリー代数フィードバック制御ポリシーとして適用した場合、および困難な現実的なシナリオでのクワッドローターの軌道の最適化において、外乱に対するロバスト性を実証します。
実験によれば、提案されたアプローチは、最適化中に構成、速度、および入力に関して定義された一般的な制約を効果的に管理すると同時に、結果として得られる制御ポリシーを閉ループで実行する際に外乱下でも安定性を維持することが示されています。

要約(オリジナル)

Matrix Lie groups are an important class of manifolds commonly used in control and robotics, and optimizing control policies on these manifolds is a fundamental problem. In this work, we propose a novel computationally efficient approach for trajectory optimization on matrix Lie groups using an augmented Lagrangian-based constrained discrete Differential Dynamic Programming (DDP). The method involves lifting the optimization problem to the Lie algebra during the backward pass and retracting back to the manifold during the forward pass. Unlike previous approaches that addressed constraint handling only for specific classes of matrix Lie groups, the proposed method provides a general solution for nonlinear constraint handling across generic matrix Lie groups. We evaluate the effectiveness of the proposed DDP method in handling constraints within a mechanical system characterized by rigid body dynamics in SE(3), assessing its computational efficiency compared to existing direct optimization solvers. Additionally, the method demonstrates robustness under external disturbances when applied as a Lie-algebraic feedback control policy on SE(3), and in optimizing a quadrotor’s trajectory in a challenging realistic scenario. Experiments show that the proposed approach effectively manages general constraints defined on configuration, velocity, and inputs during optimization, while also maintaining stability under external disturbances when executing the resultant control policy in closed-loop.

arxiv情報

著者 Gokhan Alcan,Fares J. Abu-Dakka,Ville Kyrki
発行日 2024-10-14 17:55:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク