On the Surprising Effectiveness of Spectrum Clipping in Learning Stable Linear Dynamics

要約

データから安定した線形動的システムを学習する場合、i) 予測精度、ii) 証明可能な安定性、および iii) 計算効率という 3 つの重要な特性が望ましいです。
再構成エラーを制約なく最小化すると、高い精度と効率が得られますが、安定性は保証できません。
この問題を解決する既存の方法は、精度を確保しながら安定性を強化することに焦点を当てていますが、そのためには計算量の増加が必要になります。
この研究では、単純なアプローチが安定した線形システムを学習するという 3 つの要望をすべて同時に提供できるかどうかを調査します。
具体的には、制約のない方法で学習された後に、学習されたシステム行列のスペクトルを操作するポストホックなアプローチを検討します。
このアプローチには、固有分解と、(固有ベクトルを変更せずに) 1 対 1 より大きいすべての固有値をクリップした後のシステム行列の再構築が含まれるため、このアプローチをスペクトル クリッピング (SC) と呼びます。
2 つの異なるアプリケーションと公開されているベンチマーク データセットを含む詳細な実験を通じて、この単純な手法が安定していることが証明されている高精度の線形システムを同時に学習できることを実証します。
特に、SC は桁違いに高速でありながら、強力なベースラインと同等以上のパフォーマンスを達成できることを実証しています。
また、SC を Koopman オペレーターと容易に組み合わせて、複数の指のロボットハンドを含む複雑な器用な操作スキルの基礎となる安定した非線形ダイナミクスを学習できることも示します。
さらに、トレーニング データに失敗したデモンストレーションや切り捨てられたデモンストレーションが含まれている場合でも、SC は安定したロボット ポリシーを学習できることがわかりました。
コードとデータセットは https://github.com/GT-STAR-Lab/spec_clip でご覧いただけます。

要約(オリジナル)

When learning stable linear dynamical systems from data, three important properties are desirable: i) predictive accuracy, ii) provable stability, and iii) computational efficiency. Unconstrained minimization of reconstruction errors leads to high accuracy and efficiency but cannot guarantee stability. Existing methods to remedy this focus on enforcing stability while also ensuring accuracy, but do so only at the cost of increased computation. In this work, we investigate if a straightforward approach can simultaneously offer all three desiderata of learning stable linear systems. Specifically, we consider a post-hoc approach that manipulates the spectrum of the learned system matrix after it is learned in an unconstrained fashion. We call this approach spectrum clipping (SC) as it involves eigen decomposition and subsequent reconstruction of the system matrix after clipping all of its eigenvalues that are larger than one to one (without altering the eigenvectors). Through detailed experiments involving two different applications and publicly available benchmark datasets, we demonstrate that this simple technique can simultaneously learn highly accurate linear systems that are provably stable. Notably, we demonstrate that SC can achieve similar or better performance than strong baselines while being orders-of-magnitude faster. We also show that SC can be readily combined with Koopman operators to learn stable nonlinear dynamics, such as those underlying complex dexterous manipulation skills involving multi-fingered robotic hands. Further, we find that SC can learn stable robot policies even when the training data includes unsuccessful or truncated demonstrations. Our codes and dataset can be found at https://github.com/GT-STAR-Lab/spec_clip.

arxiv情報

著者 Hanyao Guo,Yunhai Han,Harish Ravichandar
発行日 2025-01-15 01:31:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク