Deep active learning for nonlinear system identification

要約

非線形動的システムのモデル化におけるニューラル ネットワークに対する爆発的な研究の関心は、データから直接複雑な入出力関係をモデル化するネットワークの能力によって大きく説明されます。
ただし、通常、それらを適切に使用するには、膨大なトレーニング データが必要です。
動的システムのデータ生成プロセスは、時間とリソースの両方の面で高価な作業になる可能性があります。
アクティブ ラーニングは、最も有益なデータを取得することでこの欠点に対処し、膨大なデータセットを収集する必要性を減らします。
現在の研究をユニークなものにしているのは、ディープ アクティブ ラーニング フレームワークを非線形システム同定に統合していることです。
非線形システム同定のための一般的な静的ディープ アクティブ ラーニング獲得問題を定式化します。
これは、入力空間のさまざまな領域でシステムのダイナミクスをローカルに調査して、より広い入力空間をカバーするシミュレートされたデータセットを取得することで可能になります。
このシミュレートされたデータセットは、グローバル探索と呼ばれる静的なディープ アクティブ ラーニング取得スキームで使用できます。
グローバル探査は、バッチ取得関数に従って、最も有益な状態-アクション軌跡に対応する初期状態のバッチを取得します。
ローカル探索では、最適な制御問題を解決し、ある程度の情報量を最大化する制御軌道を見つけます。
有益な初期状態のバッチが取得された後、システムからデータを取得するためにシステム ダイナミクスに適用される一連の対応する制御軌跡を取得するために、バッチ内の初期状態からのローカル探索の新しいラウンドが実行されます。
取得スキームで使用される情報尺度は、ニューラル ネットワークのアンサンブルの予測分散から導出されます。
新しい方法は、シミュレートされたデータで実行されたケーススタディで、非線形動的システムのシステム同定に使用される標準的なデータ取得方法よりも優れています。

要約(オリジナル)

The exploding research interest for neural networks in modeling nonlinear dynamical systems is largely explained by the networks’ capacity to model complex input-output relations directly from data. However, they typically need vast training data before they can be put to any good use. The data generation process for dynamical systems can be an expensive endeavor both in terms of time and resources. Active learning addresses this shortcoming by acquiring the most informative data, thereby reducing the need to collect enormous datasets. What makes the current work unique is integrating the deep active learning framework into nonlinear system identification. We formulate a general static deep active learning acquisition problem for nonlinear system identification. This is enabled by exploring system dynamics locally in different regions of the input space to obtain a simulated dataset covering the broader input space. This simulated dataset can be used in a static deep active learning acquisition scheme referred to as global explorations. The global exploration acquires a batch of initial states corresponding to the most informative state-action trajectories according to a batch acquisition function. The local exploration solves an optimal control problem, finding the control trajectory that maximizes some measure of information. After a batch of informative initial states is acquired, a new round of local explorations from the initial states in the batch is conducted to obtain a set of corresponding control trajectories that are to be applied on the system dynamics to get data from the system. Information measures used in the acquisition scheme are derived from the predictive variance of an ensemble of neural networks. The novel method outperforms standard data acquisition methods used for system identification of nonlinear dynamical systems in the case study performed on simulated data.

arxiv情報

著者 Erlend Torje Berg Lundby,Adil Rasheed,Ivar Johan Halvorsen,Dirk Reinhardt,Sebastien Gros,Jan Tommy Gravdahl
発行日 2023-02-24 14:46:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IT, cs.SY, eess.SY, math.IT パーマリンク