Long-term instabilities of deep learning-based digital twins of the climate system: The cause and a solution

要約

タイトル:気候システムの深層学習デジタルツインの長期的な不安定性:原因とその解決策

要約:

– 気候システムのデータ駆動型デジタルツインは、長期的な安定性が重要である。
– これらのデジタルツインは、サブシーズンとシーズンの極端な環境イベントの予測、大量のアンサンブルメンバーが必要な確率的予測、コンピュータ上で扱いやすい高解像度の地球システムモデルを可能にする。
– 物理ベースのデジタルツインは長期的に安定しているが、リアルタイムな意思決定には手が届かない。
– データ駆動型デジタルツインは物理ベースの代替方法を提供できるが、20日を超えると不安定になり、短期予測しか行えない。
– 本論文では、どのような流れ場でも不安定性の普遍的な原因は、スペクトルバイアスによるものであり、どのような深層学習アーキテクチャでも大規模なダイナミクスしか学習せず、小規模なスケールを完全に無視することが原因であることが明らかにされた。
– 混乱物理学と深層学習ベースの時間積分器における収束の欠如がこのバイアスを増幅し、不安定なエラー伝播を引き起こすことが説明された。
– 最後に、擬渦度流とECMWF再解析データをテストケースとして使用し、深層学習理論と基礎的な数値解析のギャップを埋めて、このような不安定性に対する1つの緩和策を提案した。 we develop long-term stable digital twins for the climate system and demonstrate accurate short-term forecasts, and hundreds of years of long-term stable time-integration with accurate mean and variability.

要約(オリジナル)

Long-term stability is a critical property for deep learning-based data-driven digital twins of the Earth system. Such data-driven digital twins enable sub-seasonal and seasonal predictions of extreme environmental events, probabilistic forecasts, that require a large number of ensemble members, and computationally tractable high-resolution Earth system models where expensive components of the models can be replaced with cheaper data-driven surrogates. Owing to computational cost, physics-based digital twins, though long-term stable, are intractable for real-time decision-making. Data-driven digital twins offer a cheaper alternative to them and can provide real-time predictions. However, such digital twins can only provide short-term forecasts accurately since they become unstable when time-integrated beyond 20 days. Currently, the cause of the instabilities is unknown, and the methods that are used to improve their stability horizons are ad-hoc and lack rigorous theory. In this paper, we reveal that the universal causal mechanism for these instabilities in any turbulent flow is due to \textit{spectral bias} wherein, \textit{any} deep learning architecture is biased to learn only the large-scale dynamics and ignores the small scales completely. We further elucidate how turbulence physics and the absence of convergence in deep learning-based time-integrators amplify this bias leading to unstable error propagation. Finally, using the quasigeostrophic flow and ECMWF Reanalysis data as test cases, we bridge the gap between deep learning theory and fundamental numerical analysis to propose one mitigative solution to such instabilities. We develop long-term stable data-driven digital twins for the climate system and demonstrate accurate short-term forecasts, and hundreds of years of long-term stable time-integration with accurate mean and variability.

arxiv情報

著者 Ashesh Chattopadhyay,Pedram Hassanzadeh
発行日 2023-04-14 09:49:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, cs.NA, math.NA, physics.ao-ph, physics.flu-dyn パーマリンク