この論文では、長期時空間データの機械学習モデルのベンチマークを目的とした、40 年以上にわたる最長の台風衛星画像データセットの新バージョンであるデジタル台風データセット V2 について説明します。
データセット V2 に新しく追加されたのは、データセット V1 の北半球のデータに加えて、南半球の熱帯低気圧のデータです。
2 つの半球からのデータがあれば、盆地と半球にわたる地域的な違いについて新しい研究上の疑問を投げかけることができます。
LSTM モデルと組み合わせて、強度予測および温帯移行予測タスクのパフォーマンスについて説明します。
データセットは \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} および \url{https://github.com/kitamoto-lab/digital-typhoon/ で公開されています。
This paper presents the Digital Typhoon Dataset V2, a new version of the longest typhoon satellite image dataset for 40+ years aimed at benchmarking machine learning models for long-term spatio-temporal data. The new addition in Dataset V2 is tropical cyclone data from the southern hemisphere, in addition to the northern hemisphere data in Dataset V1. Having data from two hemispheres allows us to ask new research questions about regional differences across basins and hemispheres. We also discuss new developments in representations and tasks of the dataset. We first introduce a self-supervised learning framework for representation learning. Combined with the LSTM model, we discuss performance on intensity forecasting and extra-tropical transition forecasting tasks. We then propose new tasks, such as the typhoon center estimation task. We show that an object detection-based model performs better for stronger typhoons. Finally, we study how machine learning models can generalize across basins and hemispheres, by training the model on the northern hemisphere data and testing it on the southern hemisphere data. The dataset is publicly available at \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} and \url{https://github.com/kitamoto-lab/digital-typhoon/}.
著者 | Asanobu Kitamoto,Erwan Dzik,Gaspar Faure |
発行日 | 2024-11-25 14:25:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google