Epidemic Control on a Large-Scale-Agent-Based Epidemiology Model using Deep Deterministic Policy Gradient



– ロックダウン、迅速なワクチン接種、学校閉鎖、経済刺激などの措置を講じることでパンデミックの影響を緩和しようとしているが、これらの介入は正ならず負の影響も生じる。
– 現在の研究によると、介入戦略を自動的に最適化することが制限され、シミュレーション目的、規模(数千人)、介入研究には適さないモデル種類、探索できる介入戦略の数(離散的または連続的)に制限がある。
– これらの課題に対処し、多目的最適化を行う大規模(10万人)の流行病エージェントベースシミュレーション上で、深層決定的方策勾配(DDPG)ベースの方策最適化フレームワークを使用して、ロックダウンとワクチン接種の最適方策を決定する。
– 未成年者および高齢者に対するロックダウンやワクチン接種がない場合、結果は健康目標(感染、入院)をバランスよく維持し、最適な経済(貧困ライン以下の個人)を示す。
– これらの結果の進一歩として、より詳細なシミュレーションが必要であり、フレームワークをオープンソース化する必要があります。


To mitigate the impact of the pandemic, several measures include lockdowns, rapid vaccination programs, school closures, and economic stimulus. These interventions can have positive or unintended negative consequences. Current research to model and determine an optimal intervention automatically through round-tripping is limited by the simulation objectives, scale (a few thousand individuals), model types that are not suited for intervention studies, and the number of intervention strategies they can explore (discrete vs continuous). We address these challenges using a Deep Deterministic Policy Gradient (DDPG) based policy optimization framework on a large-scale (100,000 individual) epidemiological agent-based simulation where we perform multi-objective optimization. We determine the optimal policy for lockdown and vaccination in a minimalist age-stratified multi-vaccine scenario with a basic simulation for economic activity. With no lockdown and vaccination (mid-age and elderly), results show optimal economy (individuals below the poverty line) with balanced health objectives (infection, and hospitalization). An in-depth simulation is needed to further validate our results and open-source our framework.


著者 Gaurav Deshkar,Jayanta Kshirsagar,Harshal Hayatnagarkar,Janani Venugopalan
発行日 2023-04-10 09:26:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.SY, eess.SY パーマリンク