Convergence of Gradient-based MAML in LQR

要約

この研究論文の主な目的は、線形システム二次最適制御 (LQR) に適用した場合のモデル非依存メタ学習 (MAML) の局所収束特性を調査することです。
MAML とそのバリエーションは、回帰、分類、強化学習などの分野で以前の学習知識を活用して、新しいタスクに迅速に適応するための一般的な手法となっています。
ただし、その理論的な保証は非凸性とその構造のために依然として不明であり、動的システム設定での安定性を確保することがさらに困難になっています。
この研究は、動的システムの安定性を維持しながら局所収束保証を提供する、LQR 設定における MAML の探索に焦点を当てています。
この論文では、LQR タスクにおける MAML の収束特性を示す簡単な数値結果も示しています。

要約(オリジナル)

The main objective of this research paper is to investigate the local convergence characteristics of Model-agnostic Meta-learning (MAML) when applied to linear system quadratic optimal control (LQR). MAML and its variations have become popular techniques for quickly adapting to new tasks by leveraging previous learning knowledge in areas like regression, classification, and reinforcement learning. However, its theoretical guarantees remain unknown due to non-convexity and its structure, making it even more challenging to ensure stability in the dynamic system setting. This study focuses on exploring MAML in the LQR setting, providing its local convergence guarantees while maintaining the stability of the dynamical system. The paper also presents simple numerical results to demonstrate the convergence properties of MAML in LQR tasks.

arxiv情報

著者 Negin Musavi,Geir E. Dullerud
発行日 2023-09-15 17:22:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY パーマリンク