Hierarchically Disentangled Recurrent Network for Factorizing System Dynamics of Multi-scale Systems

要約

我々は、マルチスケールプロセスをモデル化するための知識誘導型機械学習(KGML)フレームワークを紹介し、水文学における流量予測の文脈でそのパフォーマンスを研究します。
具体的には、システムのダイナミクスを複数の時間スケールで因数分解し、それらの相互作用を捕捉する、新しい階層的リカレント ニューラル アーキテクチャを提案します。
このフレームワークは、逆モデルと順モデルで構成されます。
逆モデルは、データ (物理モデル シミュレーション、観測データ、または過去のそれらの組み合わせ) からシステムの時間モードを経験的に解決するために使用され、これらの状態は順モデルで使用されて流れを予測します。
水文学システムでは、これらのモードは、さまざまな時間スケールで展開するさまざまなプロセスを表すことができます (例: 低速: 地下水の涵養と基礎流量 vs. 高速: 極度の降雨による地表流出)。
私たちのフレームワークの主な利点は、一度トレーニングすると、データ同化のために物理科学で伝統的に使用されている高価な最適化アプローチ (EnKF など) を使用せずに、新しい観察をモデルのコンテキスト (内部状態) に組み込むことができることです。
NWS NCRFC 地域のいくつかの河川流域での実験では、特に長い観測の歴史を持つ流域において、標準ベースラインと比較したこの ML ベースのデータ同化フレームワークの有効性が示されています。
観測履歴が短い盆地であっても、FHNN フレームワークをトレーニングする 2 つの直交する戦略を提示します。(a) 不完全なシミュレーションからのシミュレーション データを使用する方法と、(b) 複数の盆地からの観測データを使用して全球モデルを構築する方法です。
これらの戦略は両方とも (個別に使用することも、一緒に使用することもできます)、トレーニング データの不足を軽減するのに非常に効果的であることを示します。
予測精度の向上は、データがまばらであるためにローカル モデルのパフォーマンスが低い流域で特に注目に値します。

要約(オリジナル)

We present a knowledge-guided machine learning (KGML) framework for modeling multi-scale processes, and study its performance in the context of streamflow forecasting in hydrology. Specifically, we propose a novel hierarchical recurrent neural architecture that factorizes the system dynamics at multiple temporal scales and captures their interactions. This framework consists of an inverse and a forward model. The inverse model is used to empirically resolve the system’s temporal modes from data (physical model simulations, observed data, or a combination of them from the past), and these states are then used in the forward model to predict streamflow. In a hydrological system, these modes can represent different processes, evolving at different temporal scales (e.g., slow: groundwater recharge and baseflow vs. fast: surface runoff due to extreme rainfall). A key advantage of our framework is that once trained, it can incorporate new observations into the model’s context (internal state) without expensive optimization approaches (e.g., EnKF) that are traditionally used in physical sciences for data assimilation. Experiments with several river catchments from the NWS NCRFC region show the efficacy of this ML-based data assimilation framework compared to standard baselines, especially for basins that have a long history of observations. Even for basins that have a shorter observation history, we present two orthogonal strategies of training our FHNN framework: (a) using simulation data from imperfect simulations and (b) using observation data from multiple basins to build a global model. We show that both of these strategies (that can be used individually or together) are highly effective in mitigating the lack of training data. The improvement in forecast accuracy is particularly noteworthy for basins where local models perform poorly because of data sparsity.

arxiv情報

著者 Rahul Ghosh,Zac McEachran,Arvind Renganathan,Kelly Lindsay,Somya Sharma,Michael Steinbach,John Nieber,Christopher Duffy,Vipin Kumar
発行日 2024-07-29 16:25:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク