Self-Supervised Meta-Learning for All-Layer DNN-Based Adaptive Control with Stability Guarantees

要約

適応制御の重要な目標は、ロボットが動的な環境に迅速に適応できるようにすることです。
最近の研究では、メタ学習を使用してオフライン データから非線形特徴 (ディープ ニューラル ネットワーク (DNN) で表される) を抽出し、適応制御を使用して線形係数をオンラインで更新するメタ学習ベースの適応制御スキームが開発されました。
ただし、このようなスキームは不確実性の線形パラメーター化によって基本的に制限されており、DNN の機能を完全に解放することはできません。
この論文では、オフラインの軌跡から自己教師ありメタ学習 (SSML) を介して DNN を事前トレーニングし、複合適応を介して完全な DNN をオンラインで適応させる、新しい学習ベースの適応制御フレームワークを紹介します。
特に、オフライン SSML ステージでは、軌跡データの時間一貫性を利用して、環境条件ラベルを使用せずに自己教師型で履歴から将来の外乱を予測するように DNN をトレーニングします。
オンライン ステージでは、安定性が保証された完全な DNN を更新するための制御則と適応則が慎重に設計されます。
経験的に、提案されたフレームワークは、大規模な動的風擾乱の下で現実世界のクワッドローター追跡問題に挑戦する際に、さまざまな古典的および学習ベースの適応制御ベースラインを大幅に上回ります (19 ~ 39%)。

要約(オリジナル)

A critical goal of adaptive control is enabling robots to rapidly adapt in dynamic environments. Recent studies have developed a meta-learning-based adaptive control scheme, which uses meta-learning to extract nonlinear features (represented by Deep Neural Networks (DNNs)) from offline data, and uses adaptive control to update linear coefficients online. However, such a scheme is fundamentally limited by the linear parameterization of uncertainties and does not fully unleash the capability of DNNs. This paper introduces a novel learning-based adaptive control framework that pretrains a DNN via self-supervised meta-learning (SSML) from offline trajectories and online adapts the full DNN via composite adaptation. In particular, the offline SSML stage leverages the time consistency in trajectory data to train the DNN to predict future disturbances from history, in a self-supervised manner without environment condition labels. The online stage carefully designs a control law and an adaptation law to update the full DNN with stability guarantees. Empirically, the proposed framework significantly outperforms (19-39%) various classic and learning-based adaptive control baselines, in challenging real-world quadrotor tracking problems under large dynamic wind disturbance.

arxiv情報

著者 Guanqi He,Yogita Choudhary,Guanya Shi
発行日 2024-10-28 20:33:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク