Regression modelling of spatiotemporal extreme U.S. wildfires via partially-interpretable neural networks

要約

多くの環境設定におけるリスク管理には、極端な現象を引き起こすメカニズムを理解する必要があります。
このようなリスクを定量化するための有用な指標は、気候、生物圏、環境状態などを記述する予測変数に基づいて条件付けされた応答変数の極端な分位数です。
通常、これらの分位数は観察可能なデータの範囲外にあるため、推定するには回帰フレームワーク内のパラメトリック極値モデルの仕様が必要です。
この文脈における古典的なアプローチは、予測変数と応答変数の間の線形または加算的な関係を利用するため、予測能力または計算効率のいずれかに問題があります。
さらに、その単純さから、極端な山火事の発生につながる真に複雑な構造を捉えることはできそうにありません。
この論文では、人工ニュートラル ネットワークを使用して極端な分位点回帰を実行するための新しい方法論的フレームワークを提案します。このネットワークは、複雑な非線形関係をキャプチャし、高次元データに適切に拡張することができます。
ニューラル ネットワークの「ブラック ボックス」という性質は、実践者がよく好む解釈可能性という望ましい特性がニューラル ネットワークには欠けていることを意味します。
したがって、線形および加法的な回帰手法を深層学習と統合して、統計的推論に使用でき、高い予測精度を維持できる部分的に解釈可能なニューラル ネットワークを作成します。
この方法論を補完するために、分布の一般化された極値クラスに関連する有限の下端点問題を克服する、極値に対する新しい点過程モデルをさらに提案します。
私たちの統一フレームワークの有効性は、高次元の予測子セットを使用した米国の山火事データで示されており、線形およびスプラインベースの回帰手法と比べて予測パフォーマンスが大幅に向上していることが示されています。

要約(オリジナル)

Risk management in many environmental settings requires an understanding of the mechanisms that drive extreme events. Useful metrics for quantifying such risk are extreme quantiles of response variables conditioned on predictor variables that describe, e.g., climate, biosphere and environmental states. Typically these quantiles lie outside the range of observable data and so, for estimation, require specification of parametric extreme value models within a regression framework. Classical approaches in this context utilise linear or additive relationships between predictor and response variables and suffer in either their predictive capabilities or computational efficiency; moreover, their simplicity is unlikely to capture the truly complex structures that lead to the creation of extreme wildfires. In this paper, we propose a new methodological framework for performing extreme quantile regression using artificial neutral networks, which are able to capture complex non-linear relationships and scale well to high-dimensional data. The ‘black box’ nature of neural networks means that they lack the desirable trait of interpretability often favoured by practitioners; thus, we unify linear, and additive, regression methodology with deep learning to create partially-interpretable neural networks that can be used for statistical inference but retain high prediction accuracy. To complement this methodology, we further propose a novel point process model for extreme values which overcomes the finite lower-endpoint problem associated with the generalised extreme value class of distributions. Efficacy of our unified framework is illustrated on U.S. wildfire data with a high-dimensional predictor set and we illustrate vast improvements in predictive performance over linear and spline-based regression techniques.

arxiv情報

著者 Jordan Richards,Raphaël Huser
発行日 2024-03-07 17:23:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク