Machine learning surrogates for efficient hydrologic modeling: Insights from stochastic simulations of managed aquifer recharge

要約

プロセスベースの水文モデルは、陸域の水循環を理解し、現代の水資源問題に対処するための貴重なツールです。
ただし、多くの水文学モデルは計算コストが高く、解像度とスケールによっては、シミュレーションが完了するまでに数時間から数日かかる場合があります。
不確実性の定量化や最適化などの手法は、経営上の意思決定をサポートするための貴重なツールとなっていますが、これらの分析には通常、何百ものモデル シミュレーションが必要であり、プロセスベースの水文モデルで実行するには計算コストが高すぎます。
このギャップに対処するために、プロセスベースのモデルを使用してシミュレーションの初期セットを生成し、機械学習 (ML) サロゲート モデルをトレーニングして下流の分析に必要な残りのシミュレーションを実行するハイブリッド モデリング ワークフローを提案します。
ケーススタディとして、このワークフローを、将来の管理された帯水層涵養 (MAR) サイトにおける変動する飽和地下水の流れのシミュレーションに適用します。
ディープ畳み込みネットワーク、リカレント ニューラル ネットワーク、ビジョン トランスフォーマー、フーリエ変換を備えたネットワークなど、いくつかの ML アーキテクチャの精度と計算効率を比較します。
私たちの結果は、ML サロゲート モデルが平均絶対パーセンテージ エラーを 10% 未満に抑え、処理ベースのモデルに比べて桁違いにランタイムを節約できることを示しています。
また、精度を向上させるためのデータ正規化の実装、トレーニングの安定性を向上させるための正規化された損失関数の使用、メモリ要件を削減するための入力特徴のダウンサンプリングなど、水文サロゲート モデルをトレーニングするための実践的な推奨事項も提供します。

要約(オリジナル)

Process-based hydrologic models are invaluable tools for understanding the terrestrial water cycle and addressing modern water resources problems. However, many hydrologic models are computationally expensive and, depending on the resolution and scale, simulations can take on the order of hours to days to complete. While techniques such as uncertainty quantification and optimization have become valuable tools for supporting management decisions, these analyses typically require hundreds of model simulations, which are too computationally expensive to perform with a process-based hydrologic model. To address this gap, we propose a hybrid modeling workflow in which a process-based model is used to generate an initial set of simulations and a machine learning (ML) surrogate model is then trained to perform the remaining simulations required for downstream analysis. As a case study, we apply this workflow to simulations of variably saturated groundwater flow at a prospective managed aquifer recharge (MAR) site. We compare the accuracy and computational efficiency of several ML architectures, including deep convolutional networks, recurrent neural networks, vision transformers, and networks with Fourier transforms. Our results demonstrate that ML surrogate models can achieve under 10% mean absolute percentage error and yield order-of-magnitude runtime savings over processed-based models. We also offer practical recommendations for training hydrologic surrogate models, including implementing data normalization to improve accuracy, using a normalized loss function to improve training stability and downsampling input features to decrease memory requirements.

arxiv情報

著者 Timothy Dai,Kate Maher,Zach Perzan
発行日 2024-07-30 15:24:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.geo-ph パーマリンク