ChaosBench: A Multi-Channel, Physics-Based Benchmark for Subseasonal-to-Seasonal Climate Prediction

要約

亜季節から季節のスケールでの気候の正確な予測は、災害への備えと気候変動の中での確実な意思決定にとって非常に重要です。
しかし、天気のタイムスケールを超えた予測は、境界相互作用、バタフライ効果、人間の本質的な物理的理解の欠如など、初期条件以外の問題に対処するため、困難です。
現在、既存のベンチマークは、予測範囲が最大 15 日と短く、広範囲の運用ベースラインが含まれておらず、説明可能性のための物理ベースの制約が欠けている傾向があります。
そこで、データ駆動型気象エミュレータの予測可能範囲を S2S タイムスケールまで拡張するための挑戦的なベンチマークである ChaosBench を提案します。
まず、ChaosBench は、典型的な地表大気の ERA5 を超える変数で構成されており、境界条件を尊重した完全な地球システムのエミュレーションを可能にする、45 年以上にわたる海洋、氷、陸地の再解析プロダクトも含まれています。
また、バタフライ効果を考慮した物理的に一貫したアンサンブルを確保するために、決定論的および確率論的なメトリクスに加えて、物理ベースのメトリクスも提案します。
さらに、当社は、ViT/ClimaX、PanguWeather、GraphCast、FourCastNetV2 などのデータ主導型の対応機関のベースラインとして、4 つの国立気象機関からの物理ベースのさまざまな予報を評価しています。
全体として、もともと気象スケールのアプリケーションのために開発された手法は S2S タスクでは失敗していることがわかります。そのパフォーマンスは未熟な気候学によって単純に崩壊します。
それにもかかわらず、アンサンブルの使用、誤差伝播の堅牢な制御、物理情報に基づいたモデルの使用など、既存の気象エミュレータの予測範囲を拡張できるいくつかの戦略を概説し、実証します。
私たちのベンチマーク、データセット、手順は https://leap-stc.github.io/ChaosBench で入手できます。

要約(オリジナル)

Accurate prediction of climate in the subseasonal-to-seasonal scale is crucial for disaster preparedness and robust decision making amidst climate change. Yet, forecasting beyond the weather timescale is challenging because it deals with problems other than initial condition, including boundary interaction, butterfly effect, and our inherent lack of physical understanding. At present, existing benchmarks tend to have shorter forecasting range of up-to 15 days, do not include a wide range of operational baselines, and lack physics-based constraints for explainability. Thus, we propose ChaosBench, a challenging benchmark to extend the predictability range of data-driven weather emulators to S2S timescale. First, ChaosBench is comprised of variables beyond the typical surface-atmospheric ERA5 to also include ocean, ice, and land reanalysis products that span over 45 years to allow for full Earth system emulation that respects boundary conditions. We also propose physics-based, in addition to deterministic and probabilistic metrics, to ensure a physically-consistent ensemble that accounts for butterfly effect. Furthermore, we evaluate on a diverse set of physics-based forecasts from four national weather agencies as baselines to our data-driven counterpart such as ViT/ClimaX, PanguWeather, GraphCast, and FourCastNetV2. Overall, we find methods originally developed for weather-scale applications fail on S2S task: their performance simply collapse to an unskilled climatology. Nonetheless, we outline and demonstrate several strategies that can extend the predictability range of existing weather emulators, including the use of ensembles, robust control of error propagation, and the use of physics-informed models. Our benchmark, datasets, and instructions are available at https://leap-stc.github.io/ChaosBench.

arxiv情報

著者 Juan Nathaniel,Yongquan Qu,Tung Nguyen,Sungduk Yu,Julius Busecke,Aditya Grover,Pierre Gentine
発行日 2024-09-27 16:27:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.CY パーマリンク