An Interpretable Hybrid Predictive Model of COVID-19 Cases using Autoregressive Model and LSTM

要約

タイトル:自己回帰モデルとLSTMを組み合わせたCOVID-19感染ケースの解釈可能なハイブリッド予測モデル

要約:
– COVID-19の世界的な健康と経済に対する影響は深刻で、ポリシー作成のために正確で解釈可能なデータ駆動型予測モデルを構築することが極めて重要である。
– 大規模なパンデミックと本質的に変化する伝達特性のため、効果的なCOVID-19ケース予測には大きな課題がある。
– この課題に対処するために、自己回帰モデル(AR)の解釈性と長短期記憶ニューラルネットワーク(LSTM)の予測力を組み合わせた革新的なハイブリッドモデルを提案する。
– 提案されたハイブリッドモデルは、2つの構成モデルブロックを接続するアーキテクチャで形式化され、トレーニング手順で相対的な貢献がデータ適応的に決定される。
– 2つのデータソースに対する包括的な数値研究を通じて、提案されたハイブリッドモデルが、2つの構成モデルと他の人気のある予測モデルより優れた性能を示すことを実証する。
– 具体的には、8つのカリフォルニア郡の郡レベルデータでは、ハイブリッドモデルが平均4.173%MAPEを達成し、構成AR(5.629%)とLSTM(4.934%)を上回る。国レベルデータセットでは、ハイブリッドモデルが世界中の8つの国でCOVID-19ケース予測に広く使用される予測モデル(AR、LSTM、SVM、Gradient Boosting、Random Forest)を上回る。
– さらに、提案されたハイブリッドモデルの解釈性を説明し、COVID-19ケースの大部分がブラックボックス予測モデルであることに対する鍵となる機能を示す。
– この研究は、公衆衛生政策作成と現在及び将来のパンデミックの制御に重要な影響を与える可能性がある、効果的かつ解釈可能なデータ駆動型モデルを構築するための新しい有望な方向を提供する。

要約(オリジナル)

The Coronavirus Disease 2019 (COVID-19) has a profound impact on global health and economy, making it crucial to build accurate and interpretable data-driven predictive models for COVID-19 cases to improve policy making. The extremely large scale of the pandemic and the intrinsically changing transmission characteristics pose great challenges for effective COVID-19 case prediction. To address this challenge, we propose a novel hybrid model in which the interpretability of the Autoregressive model (AR) and the predictive power of the long short-term memory neural networks (LSTM) join forces. The proposed hybrid model is formalized as a neural network with an architecture that connects two composing model blocks, of which the relative contribution is decided data-adaptively in the training procedure. We demonstrate the favorable performance of the hybrid model over its two component models as well as other popular predictive models through comprehensive numerical studies on two data sources under multiple evaluation metrics. Specifically, in county-level data of 8 California counties, our hybrid model achieves 4.173% MAPE on average, outperforming the composing AR (5.629%) and LSTM (4.934%). In country-level datasets, our hybrid model outperforms the widely-used predictive models – AR, LSTM, SVM, Gradient Boosting, and Random Forest – in predicting COVID-19 cases in 8 countries around the world. In addition, we illustrate the interpretability of our proposed hybrid model, a key feature not shared by most black-box predictive models for COVID-19 cases. Our study provides a new and promising direction for building effective and interpretable data-driven models, which could have significant implications for public health policy making and control of the current and potential future pandemics.

arxiv情報

著者 Yangyi Zhang,Sui Tang,Guo Yu
発行日 2023-04-18 05:58:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CY, cs.LG, stat.AP パーマリンク