要約
このホワイトペーパーでは、ブラジルのレシフェでのデング熱、チクングニヤ、ジカのアルボウイルス発生と症例数の共同予測のための長期記憶(LSTM)ネットワークに基づくマルチタスク学習アプローチを紹介します。
Datasus(2017-2023)の過去の公衆衛生データを活用すると、提案されたモデルはバイナリ分類(アウトブレイク検出)と回帰(ケース予測)タスクを同時に実行します。
スライディングウィンドウ戦略が、さまざまな入力長(60、90、および120日)を使用して時間的機能を構築するために採用され、Kerasチューナーを使用してハイパーパラメーターの最適化が実施されました。
モデル評価では、堅牢性のために時系列の交差検証を使用し、一般化評価のために2023年からの保留テストを使用しました。
結果は、より長い窓がデング熱の回帰精度を改善し、分類パフォーマンスが中間窓でピークに達し、シーケンスの長さと一般化の間の最適なトレードオフを示唆していることを示しています。
マルチタスクアーキテクチャは、病気やタスク間で競争力のあるパフォーマンスを提供し、データ制限された公衆衛生シナリオにおけるスケーラブルな流行予測のための統一されたモデリング戦略の実現可能性と利点を実証します。
要約(オリジナル)
This paper presents a multitask learning approach based on long-short-term memory (LSTM) networks for the joint prediction of arboviral outbreaks and case counts of dengue, chikungunya, and Zika in Recife, Brazil. Leveraging historical public health data from DataSUS (2017-2023), the proposed model concurrently performs binary classification (outbreak detection) and regression (case forecasting) tasks. A sliding window strategy was adopted to construct temporal features using varying input lengths (60, 90, and 120 days), with hyperparameter optimization carried out using Keras Tuner. Model evaluation used time series cross-validation for robustness and a held-out test from 2023 for generalization assessment. The results show that longer windows improve dengue regression accuracy, while classification performance peaked at intermediate windows, suggesting an optimal trade-off between sequence length and generalization. The multitask architecture delivers competitive performance across diseases and tasks, demonstrating the feasibility and advantages of unified modeling strategies for scalable epidemic forecasting in data-limited public health scenarios.
arxiv情報
著者 | Lucas R. C. Farias,Talita P. Silva,Pedro H. M. Araujo |
発行日 | 2025-05-07 16:58:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google