Advanced Predictive Modeling for Enhanced Mortality Prediction in ICU Stroke Patients Using Clinical Data

要約

背景脳卒中は、成人の障害と死亡の原因の第2位を占める。年間約1,700万人が脳卒中に罹患し、その約85%が虚血性脳卒中である。集中治療室(ICU)における虚血性脳卒中患者の死亡率を予測することは、治療戦略の最適化、資源の配分、生存率の向上にとって極めて重要である。方法ICU虚血性脳卒中患者に関するデータをMIMIC-IVデータベースから取得した(診断、バイタルサイン、臨床検査、投薬、処置、治療、臨床ノートなど)。脳卒中患者を無作為にトレーニングセット(70%、n=2441)、テストセット(15%、n=523)、検証セット(15%、n=523)に分けた。データの不均衡に対処するため、Synthetic Minority Over-sampling Technique(SMOTE)を適用した。モデル開発のために30個の特徴を選択し、最良の研究で使用された1095個の特徴から特徴数を大幅に削減した。死亡リスクを評価するための深層学習モデルを開発し、比較のためにいくつかのベースライン機械学習モデルを実装した。結果は以下の通り:特徴選択のためのXGBoostと深層学習を組み合わせたXGB-DLモデルは、偽陽性を効果的に最小化した。モデルのAUROCは、MIMIC-IVデータベースの3,646人のICU死亡患者のデータを用いて、初日の0.865(95%CI:0.821 – 0.905)から4日目には0.903(95%CI:0.868 – 0.936)に改善し、トレーニング中のAUROCは0.945(95%CI:0.944 – 0.947)であった。他のMLモデルもAUROCの点で良好な結果を示したが、我々はより高い特異性のためにDeep Learningを選択した。結論特徴選択とデータクリーニングを強化することで、提案モデルは既存モデルと比較して13%のAUROC改善を示す一方、特徴数を先行研究の1095から30に削減した。

要約(オリジナル)

Background: Stroke is second-leading cause of disability and death among adults. Approximately 17 million people suffer from a stroke annually, with about 85% being ischemic strokes. Predicting mortality of ischemic stroke patients in intensive care unit (ICU) is crucial for optimizing treatment strategies, allocating resources, and improving survival rates. Methods: We acquired data on ICU ischemic stroke patients from MIMIC-IV database, including diagnoses, vital signs, laboratory tests, medications, procedures, treatments, and clinical notes. Stroke patients were randomly divided into training (70%, n=2441), test (15%, n=523), and validation (15%, n=523) sets. To address data imbalances, we applied Synthetic Minority Over-sampling Technique (SMOTE). We selected 30 features for model development, significantly reducing feature number from 1095 used in the best study. We developed a deep learning model to assess mortality risk and implemented several baseline machine learning models for comparison. Results: XGB-DL model, combining XGBoost for feature selection and deep learning, effectively minimized false positives. Model’s AUROC improved from 0.865 (95% CI: 0.821 – 0.905) on first day to 0.903 (95% CI: 0.868 – 0.936) by fourth day using data from 3,646 ICU mortality patients in the MIMIC-IV database with 0.945 AUROC (95% CI: 0.944 – 0.947) during training. Although other ML models also performed well in terms of AUROC, we chose Deep Learning for its higher specificity. Conclusions: Through enhanced feature selection and data cleaning, proposed model demonstrates a 13% AUROC improvement compared to existing models while reducing feature number from 1095 in previous studies to 30.

arxiv情報

著者 Armin Abdollahi,Negin Ashrafi,Maryam Pishgar
発行日 2024-09-02 23:41:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG パーマリンク