WeatherBench 2: A benchmark for the next generation of data-driven global weather models


WeatherBench 2 は、Rasp らによって提案された世界的な中範囲 (1 ~ 14 日) の天気予報ベンチマークのアップデートです。
WeatherBench 2 は、オープンソースの評価フレームワーク、公開されているトレーニング、グラウンド トゥルース、ベースライン データ、および最新の指標と最先端のモデルを備えた継続的に更新される Web サイトで構成されています:
モデルのパフォーマンスの概要を提供するために、一連のヘッドライン スコアを定義します。


WeatherBench 2 is an update to the global, medium-range (1-14 day) weather forecasting benchmark proposed by Rasp et al. (2020), designed with the aim to accelerate progress in data-driven weather modeling. WeatherBench 2 consists of an open-source evaluation framework, publicly available training, ground truth and baseline data as well as a continuously updated website with the latest metrics and state-of-the-art models: This paper describes the design principles of the evaluation framework and presents results for current state-of-the-art physical and data-driven weather models. The metrics are based on established practices for evaluating weather forecasts at leading operational weather centers. We define a set of headline scores to provide an overview of model performance. In addition, we also discuss caveats in the current evaluation setup and challenges for the future of data-driven weather forecasting.


著者 Stephan Rasp,Stephan Hoyer,Alexander Merose,Ian Langmore,Peter Battaglia,Tyler Russel,Alvaro Sanchez-Gonzalez,Vivian Yang,Rob Carver,Shreya Agrawal,Matthew Chantry,Zied Ben Bouallegue,Peter Dueben,Carla Bromberg,Jared Sisk,Luke Barrington,Aaron Bell,Fei Sha
発行日 2024-01-26 14:26:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, パーマリンク