Advancing Real-time Pandemic Forecasting Using Large Language Models: A COVID-19 Case Study

要約

現在進行中の病気の発生の短期的な広がりを予測することは、要因が複雑であるため、手ごわい課題です。要因の一部は、疫学時系列データ、ウイルス生物学、人口動態、人口動態など、相互に関連した複数の様式の変数を通じて特徴付けることができます。
公共政策と人間の行動の交差点。
既存の予測モデル フレームワークは、関連データの多面性と堅牢な結果の変換に苦戦しており、そのパフォーマンスと公衆衛生の意思決定者への実用的な洞察の提供を妨げています。
私たちの研究では、マルチモーダル大規模言語モデル (LLM) を備えた新しいフレームワークである PandemicLLM を導入しています。これは、病気の蔓延のリアルタイム予測をテキスト推論問題として再定式化し、以前は存在しなかったリアルタイムの複雑な非数値情報を組み込む機能を備えています。
従来の予測モデルでは達成できません。
このアプローチは、独自の AI と人間の協調プロンプト設計と時系列表現学習を通じて、LLM 用のマルチモーダル データをエンコードします。
このモデルは、新型コロナウイルス感染症のパンデミックに適用され、テキスト形式の公衆衛生政策、ゲノム監視、空間的および疫学的時系列データを活用するようにトレーニングされ、その後、米国の 50 州すべてでテストされています。経験的に、PandemicLLM は、
新たな亜種の影響を効果的に捉え、タイムリーで正確な予測を提供できる、高性能のパンデミック予測フレームワークです。
提案された PandemicLLM は、パンデミック関連のさまざまなデータを異種形式で組み込む道を開き、既存のモデルに比べてパフォーマンス上の利点を示します。
この研究は、LLM と表現学習を適応させてパンデミック予測を強化する可能性を明らかにし、AI イノベーションが将来パンデミックへの対応と危機管理をどのように強化できるかを示しています。

要約(オリジナル)

Forecasting the short-term spread of an ongoing disease outbreak is a formidable challenge due to the complexity of contributing factors, some of which can be characterized through interlinked, multi-modality variables such as epidemiological time series data, viral biology, population demographics, and the intersection of public policy and human behavior. Existing forecasting model frameworks struggle with the multifaceted nature of relevant data and robust results translation, which hinders their performances and the provision of actionable insights for public health decision-makers. Our work introduces PandemicLLM, a novel framework with multi-modal Large Language Models (LLMs) that reformulates real-time forecasting of disease spread as a text reasoning problem, with the ability to incorporate real-time, complex, non-numerical information that previously unattainable in traditional forecasting models. This approach, through a unique AI-human cooperative prompt design and time series representation learning, encodes multi-modal data for LLMs. The model is applied to the COVID-19 pandemic, and trained to utilize textual public health policies, genomic surveillance, spatial, and epidemiological time series data, and is subsequently tested across all 50 states of the U.S. Empirically, PandemicLLM is shown to be a high-performing pandemic forecasting framework that effectively captures the impact of emerging variants and can provide timely and accurate predictions. The proposed PandemicLLM opens avenues for incorporating various pandemic-related data in heterogeneous formats and exhibits performance benefits over existing models. This study illuminates the potential of adapting LLMs and representation learning to enhance pandemic forecasting, illustrating how AI innovations can strengthen pandemic responses and crisis management in the future.

arxiv情報

著者 Hongru Du,Jianan Zhao,Yang Zhao,Shaochong Xu,Xihong Lin,Yiran Chen,Lauren M. Gardner,Hao,Yang
発行日 2024-04-10 12:22:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク