要約
干ばつは、カリフォルニアでは頻繁で費用のかかる自然災害であり、農業生産と水資源の利用可能性、特に地下水に大きな悪影響を及ぼします。
この研究では、カリフォルニアでの米国の干ばつモニター分類を予測するために、さまざまな機械学習アプローチを適用するパフォーマンスを調査しました。
4つのアプローチが使用されました:畳み込みニューラルネットワーク(CNN)、ランダムフォレスト、XGBoost、および長期記憶(LSTM)再発性ニューラルネットワーク、およびベースライン持続モデルと比較しました。
マクロF1バイナリ分類メトリックを使用して、重度の干ばつ(USDM干ばつカテゴリD2以上)を予測するモデルのパフォーマンスを評価しました。
LSTMモデルは、トップパフォーマーとして登場し、Xgboost、CNN、およびランダムフォレストが続きました。
郡レベルでの結果のさらなる評価は、LSTMモデルがより一貫した干ばつパターンを備えた郡で最も効果的であり、深刻な干ばつがより一般的であり、LSTMモデルが干ばつスコアが急速に増加した場合に悪化することを示唆しています。
30週間の履歴データを利用して、LSTMモデルは、0〜5のスケールで干ばつカテゴリの半分未満に相当する平均絶対誤差(MAE)が0.33の平均絶対誤差(MAE)で12週間の干ばつスコアを予測しました。
LSTMは0.9のマクロF1スコアを達成し、深刻な干ばつ状態のバイナリ分類における高精度を示しています。
数週間のさまざまなウィンドウと将来の地平線のサイズの評価は、少なくとも24週間のデータが最高のパフォーマンスをもたらすことを示唆しており、特に8週間未満の短い地平線のサイズで最高のパフォーマンスを発揮します。
要約(オリジナル)
Drought is a frequent and costly natural disaster in California, with major negative impacts on agricultural production and water resource availability, particularly groundwater. This study investigated the performance of applying different machine learning approaches to predicting the U.S. Drought Monitor classification in California. Four approaches were used: a convolutional neural network (CNN), random forest, XGBoost, and long short term memory (LSTM) recurrent neural network, and compared to a baseline persistence model. We evaluated the models’ performance in predicting severe drought (USDM drought category D2 or higher) using a macro F1 binary classification metric. The LSTM model emerged as the top performer, followed by XGBoost, CNN, and random forest. Further evaluation of our results at the county level suggested that the LSTM model would perform best in counties with more consistent drought patterns and where severe drought was more common, and the LSTM model would perform worse where drought scores increased rapidly. Utilizing 30 weeks of historical data, the LSTM model successfully forecasted drought scores for a 12-week period with a Mean Absolute Error (MAE) of 0.33, equivalent to less than half a drought category on a scale of 0 to 5. Additionally, the LSTM achieved a macro F1 score of 0.9, indicating high accuracy in binary classification for severe drought conditions. Evaluation of different window and future horizon sizes in weeks suggested that at least 24 weeks of data would result in the best performance, with best performance for shorter horizon sizes, particularly less than eight weeks.
arxiv情報
著者 | Nan K. Li,Angela Chang,David Sherman |
発行日 | 2025-02-12 18:20:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google