Using Machine Learning to Discover Parsimonious and Physically-Interpretable Representations of Catchment-Scale Rainfall-Runoff Dynamics

要約

最新の機械学習 (ML) 手法の現実世界の予測パフォーマンスは優れているにもかかわらず、多くの科学者は依然として、意思決定時の信頼性に寄与する相対的な解釈可能性を主な理由として、従来の物理概念 (PC) アプローチを放棄することをためらっています。
これに関連して、ML の現在十分に検討されていない側面は、システム機能に関するより良い洞察を促進できる最小限最適な表現を開発する方法です。
これがどのように達成されるかに関係なく、倹約的な表現が科学的理解の進歩をよりよくサポートすることは間違いなく真実です。
私たち自身の見解は、地球科学システムの ML ベースのモデリングは、基本的に設計によって解釈可能な計算単位の使用に基づくべきであるというものです。
このホワイト ペーパーでは、科学的調査を通じて理解を深めるために ML の強みをどのように活用できるかについての探求を続けます。
ここでは、直列および並列に配置されたノードで構成される一般的なネットワーク アーキテクチャの基本的な計算ユニットとして質量保存パーセプトロン (MCP) を使用し、入力-状態-出力を構築するための観測データの使用に関連するいくつかの一般的かつ重要な問題を調査します。
力学システムのモデル。
集中集水域モデリングの文脈において、我々は、コンテキスト依存のゲーティングとノード間での情報共有を備えた、比較的節約された分散状態のマルチフローパスネットワークを使用して、物理的解釈可能性と優れた予測パフォーマンスの両方を達成できることを示し、MCP-
ベースのモデリングは、地球科学調査への ML の適用において重要な役割を果たすことができます。

要約(オリジナル)

Despite the excellent real-world predictive performance of modern machine learning (ML) methods, many scientists remain hesitant to discard traditional physical-conceptual (PC) approaches due mainly to their relative interpretability, which contributes to credibility during decision-making. In this context, a currently underexplored aspect of ML is how to develop minimally-optimal representations that can facilitate better insight regarding system functioning. Regardless of how this is achieved, it is arguably true that parsimonious representations better support the advancement of scientific understanding. Our own view is that ML-based modeling of geoscientific systems should be based in the use of computational units that are fundamentally interpretable by design. This paper continues our exploration of how the strengths of ML can be exploited in the service of better understanding via scientific investigation. Here, we use the Mass Conserving Perceptron (MCP) as the fundamental computational unit in a generic network architecture consisting of nodes arranged in series and parallel to explore several generic and important issues related to the use of observational data for constructing input-state-output models of dynamical systems. In the context of lumped catchment modeling, we show that physical interpretability and excellent predictive performance can both be achieved using a relatively parsimonious distributed-state multiple-flow-path network with context-dependent gating and information sharing across the nodes, suggesting that MCP-based modeling can play a significant role in application of ML to geoscientific investigation.

arxiv情報

著者 Yuan-Heng Wang,Hoshin V. Gupta
発行日 2025-01-16 18:48:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク