DiffDA: a Diffusion model for weather-scale Data Assimilation

要約

正確なデータ同化による初期条件の生成は、天気予報や気候モデリングにとって非常に重要です。
我々は、予測された状態とまばらな観測を使用して大気変数を同化できるノイズ除去拡散モデルとして DiffDA を提案します。
天気予報モデルと気象アプリケーション専用のノイズ除去拡散モデルの類似性を認識し、事前学習済みの GraphCast ニューラル ネットワークを拡散モデルのバックボーンとして採用します。
ERA5再解析データセットからのシミュレートされた観測に基づく実験を通じて、私たちの方法は、全球的に0.25度(約30km)の解像度での観測と一致する、同化された全球大気データを生成することができます。
これは、ML データ同化モデルによって達成される最高の解像度を示します。
この実験では、まばらな観測(グリッド データの 0.77% 未満)と 48 時間予測から同化された初期条件が、状態からの初期条件と比較して最大 24 時間のリード タイムの損失で予測モデルに使用できることも示しています。
ERA5の最先端のデータ同化。
これにより、自己回帰データ同化による再解析データセットの作成など、現実世界のアプリケーションへのこの方法の適用が可能になります。

要約(オリジナル)

The generation of initial conditions via accurate data assimilation is crucial for weather forecasting and climate modeling. We propose DiffDA as a denoising diffusion model capable of assimilating atmospheric variables using predicted states and sparse observations. Acknowledging the similarity between a weather forecast model and a denoising diffusion model dedicated to weather applications, we adapt the pretrained GraphCast neural network as the backbone of the diffusion model. Through experiments based on simulated observations from the ERA5 reanalysis dataset, our method can produce assimilated global atmospheric data consistent with observations at 0.25 deg (~30km) resolution globally. This marks the highest resolution achieved by ML data assimilation models. The experiments also show that the initial conditions assimilated from sparse observations (less than 0.77% of gridded data) and 48-hour forecast can be used for forecast models with a loss of lead time of at most 24 hours compared to initial conditions from state-of-the-art data assimilation in ERA5. This enables the application of the method to real-world applications, such as creating reanalysis datasets with autoregressive data assimilation.

arxiv情報

著者 Langwen Huang,Lukas Gianinazzi,Yuejiang Yu,Peter D. Dueben,Torsten Hoefler
発行日 2024-03-05 16:48:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE パーマリンク