Learning Unstable Continuous-Time Stochastic Linear Control Systems

要約

単一の有限長の状態軌跡に基づいて、確率的連続時間ダイナミクスのシステム同定の問題を研究します。
適切にランダム化された制御入力を使用して、おそらく不安定な開ループ行列を推定する方法を提案します。
次に、推定誤差が軌道長、興奮性の尺度、信号対雑音比とともに減衰する一方、次元とともに増大することを示す理論的な性能保証を確立します。
ダイナミクスの学習率を示す数値イラストも提供されます。
理論的分析を実行するために、私たちは独立して関心のある新しい技術ツールを開発します。
これには、高度に非定常なマルチンゲールの非漸近的確率限界や反復対数の一般化法則などが含まれます。

要約(オリジナル)

We study the problem of system identification for stochastic continuous-time dynamics, based on a single finite-length state trajectory. We present a method for estimating the possibly unstable open-loop matrix by employing properly randomized control inputs. Then, we establish theoretical performance guarantees showing that the estimation error decays with trajectory length, a measure of excitability, and the signal-to-noise ratio, while it grows with dimension. Numerical illustrations that showcase the rates of learning the dynamics, will be provided as well. To perform the theoretical analysis, we develop new technical tools that are of independent interest. That includes non-asymptotic stochastic bounds for highly non-stationary martingales and generalized laws of iterated logarithms, among others.

arxiv情報

著者 Reza Sadeghi Hafshejani,Mohamad Kazem Shirani Fradonbeh
発行日 2024-09-17 16:24:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク