MDS-ED: Multimodal Decision Support in the Emergency Department — a Benchmark Dataset for Diagnoses and Deterioration Prediction in Emergency Medicine

要約

背景: 救急医療における医療意思決定支援の臨床的に有意義な比較評価は、マルチモーダルな入力モダリティと包括的な予測タスクを備えた適切なデータセットが不足しているため、困難です。
これは、この分野での目に見える進歩を妨げます。
結果: MIMIC-IV に基づくデータセット、ベンチマーク プロトコル、および救急部門 (ED) におけるマルチモーダル意思決定支援を評価するための初期結果を紹介します。
私たちは、患者到着後最初の 1.5 時間から、人口統計、生体認証、バイタルサイン、検査値、心電図波形などの多様なデータモダリティを使用します。
私たちは、診断の予測と患者の悪化という 2 つの状況にわたって 1,443 の臨床ラベルを分析します。
当社の診断モデルは、心筋梗塞などの心臓疾患や、腎疾患や糖尿病などの非心臓疾患を含む、1,428 疾患中 609 疾患で統計的に有意な方法で 0.8 を超える AUROC スコアを達成しています。
悪化モデルのスコアは、心停止、人工呼吸器、集中治療室への入院、短期および長期の死亡などの重篤なイベントを含む、15 ターゲット中 14 ターゲットで統計的に有意な方法で 0.8 を超えています。
さらに、生の波形入力データがモデルのパフォーマンスに与える重大な影響を示す最初の堅牢なデモンストレーションの 1 つを提供します。
結論: この研究は、提案されたデータセットが、救急医療におけるアルゴリズムによる意思決定支援の分野で目に見える進歩に向けた進歩を促進するための独自のリソースであることを強調しています。
提示されたマルチモーダル ベースライン モデルは、現場での診断意思決定サポートの可能性を示し、生の波形データを含めることに対する強力なインセンティブを提供します。

要約(オリジナル)

Background: A clinically meaningful comparative assessment of medical decision support in emergency care is challenging due to a lack of appropriate datasets with multimodal input modalities and comprehensive prediction task. This hampers measurable progress in the field. Results: We introduce a dataset based on MIMIC-IV, a benchmarking protocol, and initial results for evaluating multimodal decision support in the emergency department (ED). We use diverse data modalities from the first 1.5 hours after patient arrival, including demographics, biometrics, vital signs, lab values, and electrocardiogram waveforms. We analyze 1443 clinical labels across two contexts: predicting diagnoses and patient deterioration. Our diagnostic model achieves an AUROC score over 0.8 in a statistically significant manner for 609 out of 1428 conditions, including cardiac conditions like myocardial infarction and non-cardiac conditions such as renal disease and diabetes. The deterioration model scores above 0.8 in a statistically significant manner for 14 out of 15 targets, including critical events like cardiac arrest, mechanical ventilation, intensive care unit admission, as well as short- and long-term mortality. Furthermore, we provide one of the first robust demonstrations of the significant impact of raw waveform input data on model performance. Conclusions: This study highlights the proposed dataset as a unique resource to foster progress towards measurable progress in the domain of algorithmic decision support in emergency care. The presented multimodal baseline models showcase the potential of diagnostic decision support in the field and provide strong incentives for including raw waveform data.

arxiv情報

著者 Juan Miguel Lopez Alcaraz,Hjalmar Bouma,Nils Strodthoff
発行日 2024-09-24 15:20:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク