WaveCatBoost for Probabilistic Forecasting of Regional Air Quality Data

要約

正確で信頼性の高い大気質予測は、公衆衛生の保護、持続可能な開発、汚染防止、都市計画の強化に不可欠です。
このレターでは、最大重複離散ウェーブレット変換 (MODWT) と CatBoost モデルを組み合わせることにより、大気汚染物質のリアルタイム濃度を予測するように設計された新しい WaveCatBoost アーキテクチャを紹介します。
このハイブリッド アプローチは、時系列を高周波成分と低周波成分に効率的に変換することで、ノイズから信号を抽出し、予測精度とロバスト性を向上させます。
中央大気汚染防止委員会 (CPCB) のセンサー ネットワークと低コストの大気質センサー システム (LAQS) からの 2 つの異なる地域データセットの評価は、リアルタイム予測における私たちの提案方法論の優れたパフォーマンスを州のデータセットと比較して強調しています。
最先端の統計および深層学習アーキテクチャ。
さらに、等角予測戦略を採用して、確率バンドに予測を提供します。

要約(オリジナル)

Accurate and reliable air quality forecasting is essential for protecting public health, sustainable development, pollution control, and enhanced urban planning. This letter presents a novel WaveCatBoost architecture designed to forecast the real-time concentrations of air pollutants by combining the maximal overlapping discrete wavelet transform (MODWT) with the CatBoost model. This hybrid approach efficiently transforms time series into high-frequency and low-frequency components, thereby extracting signal from noise and improving prediction accuracy and robustness. Evaluation of two distinct regional datasets, from the Central Air Pollution Control Board (CPCB) sensor network and a low-cost air quality sensor system (LAQS), underscores the superior performance of our proposed methodology in real-time forecasting compared to the state-of-the-art statistical and deep learning architectures. Moreover, we employ a conformal prediction strategy to provide probabilistic bands with our forecasts.

arxiv情報

著者 Jintu Borah,Tanujit Chakraborty,Md. Shahrul Md. Nadzir,Mylene G. Cayetano,Shubhankar Majumdar
発行日 2024-04-08 13:01:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク