要約
正確でありながら同時に高い空間密度を持つ降水量データセットを形成するために、衛星と測量器からのデータが文献に統合されることがよくあります。
ただし、予測モデリングにおける不確実性の定量化の重要性は広く認識されているにもかかわらず、この方法で取得されたデータの不確実性の推定値はほとんど提供されていません。
さらに、機械学習がそのような推定値を提供するタスクにもたらす利点は、広く認識されておらず、ベンチマーク実験を通じて適切に調査されていません。
今回の研究は、このテーマに関する最初のベンチマーク テストを実施することで、この特定のギャップを埋めることを目的としています。
米国本土にわたる 15 年間の月次データで構成される大規模なデータセットについて、その構造上、予測不確実性の定量化に適している 6 つの学習器を徹底的に比較しました。
これらは、分位点回帰 (QR)、分位点回帰フォレスト (QRF)、一般化ランダム フォレスト (GRF)、勾配ブースティング マシン (GBM)、光勾配ブースティング マシン (LightGBM)、および分位点回帰ニューラル ネットワーク (QRNN) です。
この比較は、予測確率分布全体の適切な近似を容易にする 9 つのレベルで予測分位数を発行する学習者の能力を参照しており、主に分位数と連続ランク付け確率スキル スコアに基づいていました。
比較には 3 種類の予測変数 (衛星降水量変数、対象地点と衛星グリッド点間の距離、対象地点の標高) が使用され、さらに相互に比較されました。
この追加の比較は、機能の重要性に関する説明可能な機械学習の概念に基づいています。
結果は、調査したタスクの学習者の最良から最悪の順序は、LightGBM、QRF、GRF、GBM、QRNN、QR… であることを示唆しています。
要約(オリジナル)
To form precipitation datasets that are accurate and, at the same time, have high spatial densities, data from satellites and gauges are often merged in the literature. However, uncertainty estimates for the data acquired in this manner are scarcely provided, although the importance of uncertainty quantification in predictive modelling is widely recognized. Furthermore, the benefits that machine learning can bring to the task of providing such estimates have not been broadly realized and properly explored through benchmark experiments. The present study aims at filling in this specific gap by conducting the first benchmark tests on the topic. On a large dataset that comprises 15-year-long monthly data spanning across the contiguous United States, we extensively compared six learners that are, by their construction, appropriate for predictive uncertainty quantification. These are the quantile regression (QR), quantile regression forests (QRF), generalized random forests (GRF), gradient boosting machines (GBM), light gradient boosting machines (LightGBM) and quantile regression neural networks (QRNN). The comparison referred to the competence of the learners in issuing predictive quantiles at nine levels that facilitate a good approximation of the entire predictive probability distribution, and was primarily based on the quantile and continuous ranked probability skill scores. Three types of predictor variables (i.e., satellite precipitation variables, distances between a point of interest and satellite grid points, and elevation at a point of interest) were used in the comparison and were additionally compared with each other. This additional comparison was based on the explainable machine learning concept of feature importance. The results suggest that the order from the best to the worst of the learners for the task investigated is the following: LightGBM, QRF, GRF, GBM, QRNN and QR…
arxiv情報
著者 | Georgia Papacharalampous,Hristos Tyralis,Nikolaos Doulamis,Anastasios Doulamis |
発行日 | 2023-11-13 17:55:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google