A Data-Driven Approach to Synthesizing Dynamics-Aware Trajectories for Underactuated Robotic Systems

要約

作動が不十分なロボットシステムの関節軌道の生成と追跡制御を検討します。
一般的な解決策は、階層化された制御アーキテクチャを使用することです。最上位層は軌道生成にシステム ダイナミクスの簡略化されたモデルを使用し、下位層はフィードバック制御によってこの軌道のおおよその追跡を保証します。
このような階層化された制御アーキテクチャは標準であり、実際にはうまく機能しますが、軌道生成に使用される単純化されたモデルの選択は通常、エンジニアリングの直観と経験に依存します。
この論文では、ダイナミクスを意識した軌道生成に対する代替のデータ駆動型アプローチを提案します。
大域的な非線形最適制御問題の適切な拡張ラグランジュ再定式化により、問題全体が軌道計画層とフィードバック制御層に階層的に分解されることを示します。
重要なのは、結果として得られる軌道の最適化がダイナミクスを意識したものであり、生成された軌道の動的な実現可能性をエンコードするトラッキング ペナルティ正則化器で修正されることです。
この追跡ペナルティ正則化は、独自に設計された低層フィードバック制御ポリシーのシステム ロールアウトから学習できることを示し、シミュレーションにおける一輪車およびクワッドローター制御問題のコンテキストでフレームワークをインスタンス化します。
さらに、追加のトレーニングを行わずに、クアッドローター ハードウェア プラットフォームでの実験を通じて、私たちのアプローチがシミュレーションと実際のギャップに対処できることを示します。
合成一輪車の例とクアローター システムの両方について、私たちのフレームワークは、シミュレーションとハードウェア実験における計算時間と動的実現可能性の両方において大幅な改善を示しています。

要約(オリジナル)

We consider joint trajectory generation and tracking control for under-actuated robotic systems. A common solution is to use a layered control architecture, where the top layer uses a simplified model of system dynamics for trajectory generation, and the low layer ensures approximate tracking of this trajectory via feedback control. While such layered control architectures are standard and work well in practice, selecting the simplified model used for trajectory generation typically relies on engineering intuition and experience. In this paper, we propose an alternative data-driven approach to dynamics-aware trajectory generation. We show that a suitable augmented Lagrangian reformulation of a global nonlinear optimal control problem results in a layered decomposition of the overall problem into trajectory planning and feedback control layers. Crucially, the resulting trajectory optimization is dynamics-aware, in that, it is modified with a tracking penalty regularizer encoding the dynamic feasibility of the generated trajectory. We show that this tracking penalty regularizer can be learned from system rollouts for independently-designed low layer feedback control policies, and instantiate our framework in the context of a unicycle and a quadrotor control problem in simulation. Further, we show that our approach handles the sim-to-real gap through experiments on the quadrotor hardware platform without any additional training. For both the synthetic unicycle example and the quadrotor system, our framework shows significant improvements in both computation time and dynamic feasibility in simulation and hardware experiments.

arxiv情報

著者 Anusha Srikanthan,Fengjun Yang,Igor Spasojevic,Dinesh Thakur,Vijay Kumar,Nikolai Matni
発行日 2023-07-25 19:38:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク