Auto-Multilift: Distributed Learning and Control for Cooperative Load Transportation With Quadrotors

要約

マルチリフト システムのモーション コントロールと計画アルゴリズムの設計は、力学、衝突回避、アクチュエータの制限、拡張性の複雑さのため、依然として困難です。
最適化と分散技術を使用する既存の方法は、これらの制約とスケーラビリティの問題に効果的に対処します。
ただし、多くの場合、大幅な手動調整が必要となり、最適なパフォーマンスが得られません。
この論文では、マルチリフト システムのモデル予測コントローラー (MPC) のチューニングを自動化する新しいフレームワークである Auto-Multilift を提案します。
ディープ ニューラル ネットワーク (DNN) を使用して MPC コスト関数をモデル化し、さまざまなシナリオへの迅速なオンライン適応を可能にします。
これらの DNN を閉ループ方式で効率的にトレーニングするための分散ポリシー勾配アルゴリズムを開発します。
私たちのアルゴリズムの中心となるのは分散感度伝播であり、これはマルチリフト システム内の独自の動的結合を最大限に活用することに基づいて構築されています。
これは、クアッドローター全体にわたる勾配計算を並列化し、主要な MPC パラメーターに対する実際のシステム状態の感度に焦点を当てます。
広範なシミュレーションにより、多数のクワッドローターに対する良好なスケーラビリティが実証されました。
私たちの方法は、軌道追跡エラーから適応型 MPC を効果的に学習することにより、最先端の開ループ MPC 調整アプローチを上回ります。
また、複数の狭いスロットを横断するときにシステムを再構成するための適応リファレンスの学習にも優れています。

要約(オリジナル)

Designing motion control and planning algorithms for multilift systems remains challenging due to the complexities of dynamics, collision avoidance, actuator limits, and scalability. Existing methods that use optimization and distributed techniques effectively address these constraints and scalability issues. However, they often require substantial manual tuning, leading to suboptimal performance. This paper proposes Auto-Multilift, a novel framework that automates the tuning of model predictive controllers (MPCs) for multilift systems. We model the MPC cost functions with deep neural networks (DNNs), enabling fast online adaptation to various scenarios. We develop a distributed policy gradient algorithm to train these DNNs efficiently in a closed-loop manner. Central to our algorithm is distributed sensitivity propagation, which is built on fully exploiting the unique dynamic couplings within the multilift system. It parallelizes gradient computation across quadrotors and focuses on actual system state sensitivities relative to key MPC parameters. Extensive simulations demonstrate favorable scalability to a large number of quadrotors. Our method outperforms a state-of-the-art open-loop MPC tuning approach by effectively learning adaptive MPCs from trajectory tracking errors. It also excels in learning an adaptive reference for reconfiguring the system when traversing multiple narrow slots.

arxiv情報

著者 Bingheng Wang,Rui Huang,Lin Zhao
発行日 2024-09-12 07:35:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク