BIO-CXRNET: A Robust Multimodal Stacking Machine Learning Technique for Mortality Risk Prediction of COVID-19 Patients using Chest X-Ray Images and Clinical Data

要約

病気を迅速かつ正確に検出することで、あらゆる国の医療施設への負担を軽減し、パンデミック時の死亡率を減らすことができます。
この作業の目標は、胸部X線(CXR)画像と臨床データの両方を使用してCOVID-19患者の重症度を予測する、新しい機械学習フレームワークを使用してマルチモーダルシステムを作成することです。
さらに、この研究は、高リスク患者の死亡の可能性を予測するためのノモグラムベースのスコアリング手法を示しています。
この研究では、イタリアでのCOVID-19の第1波(2020年3月から6月)中に入院した930人のCOVID-19患者のリスクを予測する際に、25のバイオマーカーとCXR画像を使用します。
提案されたマルチモーダルスタッキング技術は、低リスクまたは高リスクの患者を識別するために、それぞれ89.03%、90.44%、および89.03%の精度、感度、およびF1スコアを生成しました。
このマルチモーダルアプローチにより、CXR画像または臨床データのみと比較して精度が6%向上しました。
最後に、多変量ロジスティック回帰を使用したノモグラムスコアリングシステムを使用して、第1段階で特定された高リスク患者の死亡リスクを層別化しました。
乳酸デヒドロゲナーゼ(LDH)、O2パーセンテージ、白血球(WBC)数、年齢、およびC反応性タンパク質(CRP)は、ランダムフォレスト特徴選択モデルを使用して有用な予測因子として特定されました。
死亡の確率を定量化し、それらをそれぞれ生存(<50%)と死亡(> = 50%)の2つのリスクグループに分類するために、5つの予測パラメーターとCXR画像ベースのノモグラムスコアが開発されました。
マルチモーダル手法は、F1スコアが92.88%の高リスク患者の死亡確率を予測することができました。
開発コホートと検証コホートの曲線の下の面積は、それぞれ0.981と0.939です。

要約(オリジナル)

Fast and accurate detection of the disease can significantly help in reducing the strain on the healthcare facility of any country to reduce the mortality during any pandemic. The goal of this work is to create a multimodal system using a novel machine learning framework that uses both Chest X-ray (CXR) images and clinical data to predict severity in COVID-19 patients. In addition, the study presents a nomogram-based scoring technique for predicting the likelihood of death in high-risk patients. This study uses 25 biomarkers and CXR images in predicting the risk in 930 COVID-19 patients admitted during the first wave of COVID-19 (March-June 2020) in Italy. The proposed multimodal stacking technique produced the precision, sensitivity, and F1-score, of 89.03%, 90.44%, and 89.03%, respectively to identify low or high-risk patients. This multimodal approach improved the accuracy by 6% in comparison to the CXR image or clinical data alone. Finally, nomogram scoring system using multivariate logistic regression — was used to stratify the mortality risk among the high-risk patients identified in the first stage. Lactate Dehydrogenase (LDH), O2 percentage, White Blood Cells (WBC) Count, Age, and C-reactive protein (CRP) were identified as useful predictor using random forest feature selection model. Five predictors parameters and a CXR image based nomogram score was developed for quantifying the probability of death and categorizing them into two risk groups: survived (<50%), and death (>=50%), respectively. The multi-modal technique was able to predict the death probability of high-risk patients with an F1 score of 92.88 %. The area under the curves for the development and validation cohorts are 0.981 and 0.939, respectively.

arxiv情報

著者 Tawsifur Rahman,Muhammad E. H. Chowdhury,Amith Khandakar,Zaid Bin Mahbub,Md Sakib Abrar Hossain,Abraham Alhatou,Eynas Abdalla,Sreekumar Muthiyal,Khandaker Farzana Islam,Saad Bin Abul Kashem,Muhammad Salman Khan,Susu M. Zughaier,Maqsud Hossain
発行日 2022-06-15 15:23:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク