要約
文献ではさまざまな方法が提案されていますが、物理システムの効率的かつ効果的な潜在空間制御 (つまり、学習された低次元空間での制御) は依然として未解決の課題です。
私たちは、有望な手段は、制御理論の文献から得られる強力でよく理解されている閉じた形式の戦略を、位置エネルギー形成などの学習されたダイナミクスと組み合わせて活用することであると主張します。
我々は、これまでのところこの強力な組み合わせを妨げている既存の潜在空間モデルの 3 つの根本的な欠点を特定します。(i) モデルには物理システムの数学的構造が欠如している、(ii) 現実のシステムの安定性特性が本質的に保存されていない、(
iii) これらのメソッドには、入力と潜在空間強制の間の可逆マッピングがありません。
この研究では、これらすべての問題に同時に取り組む新しい結合発振器ネットワーク (CON) モデルを提案します。
より具体的には、(i) CON がラグランジュ系であること、つまり、明確に定義された位置エネルギー項と運動エネルギー項を持っていることを分析的に示します。
次に、(ii) Lyapunov 引数を使用して、グローバルな入力から状態への安定性の正式な証明を提供します。
実験側に移り、機械システムの複雑な非線形ダイナミクスを画像から直接学習する場合、CON が SoA パフォーマンスに達することを実証します。
この 3 番目の目標の達成に貢献する追加の方法論的革新は、ネットワーク ダイナミクスを効率的に統合するための近似閉形式ソリューションであり、これにより効率的なトレーニングが容易になります。
(iii) には、エンコードされた潜在空間力に基づいて入力を再構成するように訓練されたデコーダを使用して、強制と入力のマッピングを近似することで取り組みます。
最後に、これらのプロパティによって潜在空間制御がどのように可能になるかを示します。
潜在的な力の補償を備えた積分飽和 PID を使用し、生のピクセルを唯一のフィードバック情報として使用してソフト ロボット上で高品質のパフォーマンスを実証します。
要約(オリジナル)
Even though a variety of methods have been proposed in the literature, efficient and effective latent-space control (i.e., control in a learned low-dimensional space) of physical systems remains an open challenge. We argue that a promising avenue is to leverage powerful and well-understood closed-form strategies from control theory literature in combination with learned dynamics, such as potential-energy shaping. We identify three fundamental shortcomings in existing latent-space models that have so far prevented this powerful combination: (i) they lack the mathematical structure of a physical system, (ii) they do not inherently conserve the stability properties of the real systems, (iii) these methods do not have an invertible mapping between input and latent-space forcing. This work proposes a novel Coupled Oscillator Network (CON) model that simultaneously tackles all these issues. More specifically, (i) we show analytically that CON is a Lagrangian system – i.e., it possesses well-defined potential and kinetic energy terms. Then, (ii) we provide formal proof of global Input-to-State stability using Lyapunov arguments. Moving to the experimental side, we demonstrate that CON reaches SoA performance when learning complex nonlinear dynamics of mechanical systems directly from images. An additional methodological innovation contributing to achieving this third goal is an approximated closed-form solution for efficient integration of network dynamics, which eases efficient training. We tackle (iii) by approximating the forcing-to-input mapping with a decoder that is trained to reconstruct the input based on the encoded latent space force. Finally, we show how these properties enable latent-space control. We use an integral-saturated PID with potential force compensation and demonstrate high-quality performance on a soft robot using raw pixels as the only feedback information.
arxiv情報
著者 | Maximilian Stölzle,Cosimo Della Santina |
発行日 | 2024-10-13 22:04:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google