CarbonSense: A Multimodal Dataset and Baseline for Carbon Flux Modelling

要約

陸生炭素フラックスは、生物圏の健全性と人為的 CO$_2$ 排出量の吸収能力に関する重要な情報を提供します。
炭素フラックスを予測することの重要性により、統計手法を使用して生物物理学的データから炭素フラックスを予測する、データ駆動型炭素フラックス モデリング (DDCFM) という新興分​​野が生まれています。
ただし、この分野にはモデル間の比較を促進するための標準化されたデータセットがありません。
このギャップに対処するために、DDCFM 用の最初の機械学習対応データセットである CarbonSense を紹介します。
CarbonSense は、測定された炭素フラックス、気象予測子、世界中の 385 か所の衛星画像を統合し、包括的なカバレッジを提供し、堅牢なモデル トレーニングを促進します。
さらに、現在の最先端の DDCFM アプローチと新しい変圧器ベースのモデルを使用したベースライン モデルも提供します。
私たちの実験は、マルチモーダル深層学習技術がこの領域にもたらす可能性のある利益を示しています。
これらのリソースを提供することで、他のディープラーニング研究者が新しいモデルを開発し、炭素フラックスモデリングの新たな進歩を推進するための参入障壁を下げることを目指しています。

要約(オリジナル)

Terrestrial carbon fluxes provide vital information about our biosphere’s health and its capacity to absorb anthropogenic CO$_2$ emissions. The importance of predicting carbon fluxes has led to the emerging field of data-driven carbon flux modelling (DDCFM), which uses statistical techniques to predict carbon fluxes from biophysical data. However, the field lacks a standardized dataset to promote comparisons between models. To address this gap, we present CarbonSense, the first machine learning-ready dataset for DDCFM. CarbonSense integrates measured carbon fluxes, meteorological predictors, and satellite imagery from 385 locations across the globe, offering comprehensive coverage and facilitating robust model training. Additionally, we provide a baseline model using a current state-of-the-art DDCFM approach and a novel transformer based model. Our experiments illustrate the potential gains that multimodal deep learning techniques can bring to this domain. By providing these resources, we aim to lower the barrier to entry for other deep learning researchers to develop new models and drive new advances in carbon flux modelling.

arxiv情報

著者 Matthew Fortier,Mats L. Richter,Oliver Sonnentag,Chris Pal
発行日 2024-06-07 13:47:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク