A Comprehensive Benchmark for COVID-19 Predictive Modeling Using Electronic Health Records in Intensive Care

要約

新型コロナウイルス感染症のパンデミックは世界中の医療システムに大きな負担を与え、多大な社会的混乱と経済的損失を引き起こしました。
電子医療記録 (EHR) データを使用して、集中治療室の新型コロナウイルス感染症患者の死亡率予測などの臨床予測タスクを実行するために、多くの深層学習モデルが提案されています。
特定の臨床応用での初期の成功にもかかわらず、現在、臨床使用に最適なモデルを選択できるように公正な比較を達成するためのベンチマーク結果が不足しています。
さらに、従来の予測タスクの定式化と集中治療における実際の臨床実践の間には矛盾があります。
これらのギャップを埋めるために、私たちは 2 つの臨床予測タスク、転帰別の在院日数予測と、集中治療室の新型コロナウイルス感染症患者の早期死亡率予測を提案します。
この 2 つのタスクは、新型コロナウイルス感染症患者の臨床現場に対応するために、単純な在院日数と死亡率の予測タスクを応用したものです。
当社は、公正で詳細なオープンソースのデータ前処理パイプラインを提案し、2 つのタスクに関して 17 の最先端の予測モデルを評価します。これには、EHR 用に特別に設計された 5 つの機械学習モデル、6 つの基本的な深層学習モデル、および 6 つの深層学習予測モデルが含まれます。
データ。
2 つの実際の COVID-19 EHR データセットのデータを使用したベンチマーク結果を提供します。
1 つのデータセットは問い合わせなしで公開されており、別のデータセットはリクエストに応じてアクセスできます。
2 つのタスクについて公平で再現可能なベンチマーク結果を提供します。
すべての実験結果とモデルをオンライン プラットフォームに展開します。
また、臨床医や研究者がデータをプラットフォームにアップロードし、トレーニングされたモデルを使用して迅速な予測結果を取得できるようにします。
私たちの取り組みにより、新型コロナウイルス感染症の予測モデリングのためのディープラーニングと機械学習の研究がさらに促進されることを願っています。

要約(オリジナル)

The COVID-19 pandemic has posed a heavy burden to the healthcare system worldwide and caused huge social disruption and economic loss. Many deep learning models have been proposed to conduct clinical predictive tasks such as mortality prediction for COVID-19 patients in intensive care units using Electronic Health Record (EHR) data. Despite their initial success in certain clinical applications, there is currently a lack of benchmarking results to achieve a fair comparison so that we can select the optimal model for clinical use. Furthermore, there is a discrepancy between the formulation of traditional prediction tasks and real-world clinical practice in intensive care. To fill these gaps, we propose two clinical prediction tasks, Outcome-specific length-of-stay prediction and Early mortality prediction for COVID-19 patients in intensive care units. The two tasks are adapted from the naive length-of-stay and mortality prediction tasks to accommodate the clinical practice for COVID-19 patients. We propose fair, detailed, open-source data-preprocessing pipelines and evaluate 17 state-of-the-art predictive models on two tasks, including 5 machine learning models, 6 basic deep learning models and 6 deep learning predictive models specifically designed for EHR data. We provide benchmarking results using data from two real-world COVID-19 EHR datasets. One dataset is publicly available without needing any inquiry and another dataset can be accessed on request. We provide fair, reproducible benchmarking results for two tasks. We deploy all experiment results and models on an online platform. We also allow clinicians and researchers to upload their data to the platform and get quick prediction results using our trained models. We hope our efforts can further facilitate deep learning and machine learning research for COVID-19 predictive modeling.

arxiv情報

著者 Junyi Gao,Yinghao Zhu,Wenqing Wang,Yasha Wang,Wen Tang,Ewen M. Harrison,Liantao Ma
発行日 2024-01-23 17:14:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク