要約
自律システムは、トレーニング データの範囲を超えた環境やシナリオに遭遇することがよくあります。これは、目に見えないシナリオをリアルタイムで一般化して適応する必要性という重要な課題を浮き彫りにします。
この課題には、適応とゼロショット転送を可能にする新しい数学的ツールとアルゴリズム ツールが必要です。
この目的を達成するために、関数エンコーダーの理論を活用します。これにより、ニューラル ネットワークの柔軟性とヒルベルト空間の数学的原理を組み合わせることでゼロショット転送が可能になります。
この理論を使用して、最初に、一連のニューラル ODE 基底関数によって広がる力学空間を学習する方法を提示します。
トレーニング後、提案されたアプローチは、効率的な内積計算を使用して、学習された空間内のダイナミクスを迅速に特定できます。
重要なことに、この計算にはオンライン段階での勾配計算や再トレーニングが必要ありません。
この方法により、実行時の自律システムのゼロショット転送が可能になり、新しいクラスの適応可能な制御アルゴリズムへの扉が開きます。
2 つの MuJoCo ロボット環境に対する最先端のシステム モデリングの精度を実証し、学習されたモデルをクアッドローターのより効率的な MPC 制御に使用できることを示します。
要約(オリジナル)
Autonomous systems often encounter environments and scenarios beyond the scope of their training data, which underscores a critical challenge: the need to generalize and adapt to unseen scenarios in real time. This challenge necessitates new mathematical and algorithmic tools that enable adaptation and zero-shot transfer. To this end, we leverage the theory of function encoders, which enables zero-shot transfer by combining the flexibility of neural networks with the mathematical principles of Hilbert spaces. Using this theory, we first present a method for learning a space of dynamics spanned by a set of neural ODE basis functions. After training, the proposed approach can rapidly identify dynamics in the learned space using an efficient inner product calculation. Critically, this calculation requires no gradient calculations or retraining during the online phase. This method enables zero-shot transfer for autonomous systems at runtime and opens the door for a new class of adaptable control algorithms. We demonstrate state-of-the-art system modeling accuracy for two MuJoCo robot environments and show that the learned models can be used for more efficient MPC control of a quadrotor.
arxiv情報
著者 | Tyler Ingebrand,Adam J. Thorpe,Ufuk Topcu |
発行日 | 2024-05-14 20:46:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google