要約
マルチリフト システムのモーション コントロールと計画アルゴリズムの設計は、力学、衝突回避、アクチュエータの制限、拡張性の複雑さのため、依然として困難です。
最適化と分散技術を使用する既存の方法は、これらの制約とスケーラビリティの問題に効果的に対処します。
ただし、多くの場合、大幅な手動調整が必要となり、最適なパフォーマンスが得られません。
この論文では、マルチリフト システムのモデル予測コントローラー (MPC) のチューニングを自動化する新しいフレームワークである Auto-Multilift を提案します。
MPC コスト関数をディープ ニューラル ネットワーク (DNN) でモデル化し、さまざまなシナリオへの迅速なオンライン適応を可能にします。
これらの DNN を閉ループ方式で効率的にトレーニングするための分散ポリシー勾配アルゴリズムを開発します。
私たちのアルゴリズムの中心となるのは、分散感度伝播です。これは、主要な MPC パラメータに対する実際のシステム状態の感度に焦点を当て、クワッドローター全体で勾配計算を並列化します。
また、このアルゴリズムの収束に対する理論的な保証も提供します。
広範なシミュレーションにより、多数のクワッドローターに対する迅速な収束と良好なスケーラビリティが示されています。
私たちの方法は、軌道追跡エラーから適応型 MPC を効果的に学習し、マルチリフト システム内の固有のダイナミクス カップリングを処理することにより、最先端の開ループ MPC 調整アプローチを上回ります。
さらに、私たちのフレームワークは、複数の狭いスロットを通過するときにシステムを再構成するための適応参照を学習できます。
要約(オリジナル)
Designing motion control and planning algorithms for multilift systems remains challenging due to the complexities of dynamics, collision avoidance, actuator limits, and scalability. Existing methods that use optimization and distributed techniques effectively address these constraints and scalability issues. However, they often require substantial manual tuning, leading to suboptimal performance. This paper proposes Auto-Multilift, a novel framework that automates the tuning of model predictive controllers (MPCs) for multilift systems. We model the MPC cost functions with deep neural networks (DNNs), enabling fast online adaptation to various scenarios. We develop a distributed policy gradient algorithm to train these DNNs efficiently in a closed-loop manner. Central to our algorithm is distributed sensitivity propagation, which parallelizes gradient computation across quadrotors, focusing on actual system state sensitivities relative to key MPC parameters. We also provide theoretical guarantees for the convergence of this algorithm. Extensive simulations show rapid convergence and favorable scalability to a large number of quadrotors. Our method outperforms a state-of-the-art open-loop MPC tuning approach by effectively learning adaptive MPCs from trajectory tracking errors and handling the unique dynamics couplings within the multilift system. Additionally, our framework can learn an adaptive reference for reconfigurating the system when traversing through multiple narrow slots.
arxiv情報
著者 | Bingheng Wang,Kuankuan Sima,Rui Huang,Lin Zhao |
発行日 | 2024-06-07 11:41:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google