要約
臨床的に意味のあるサブグループを特定する患者の層別化は、診断と治療戦略の改善を通じて個別化医療を進めるために不可欠です。
電子健康記録(EHR)、特に集中治療ユニット(ICU)の記録には、この目的のために活用できる豊富な時間的臨床データが含まれています。
この作業では、3つの公的に利用可能なICU EHRデータセットを使用して、時間的患者表現学習に基づいて患者の層別化を評価するための最初の包括的なベンチマークであるICU-TSB(時間的成層ベンチマーク)を紹介します。
私たちのベンチマークの重要な貢献は、発見されたクラスターの臨床的に検証された疾患グループの調整を測定するために、病気の分類法を利用する新しい階層評価フレームワークです。
ICU-TSBを使用した実験では、LSTMやGRUを含む統計的方法といくつかの再発性ニューラルネットワークを、患者の軌跡のその後のクラスタリングのための効果的な患者表現を生成する能力を比較しました。
我々の結果は、一時的な表現学習が臨床的に意味のある患者コホートを再発見できることを示しています。
それにもかかわらず、それは挑戦的なタスクのままであり、V測定は、分類法の最上位レベルの0.46から最低レベルの最大0.40に変化します。
調査結果の実用的な有用性をさらに強化するために、特定されたクラスターに解釈可能なラベルを割り当てるための複数の戦略も評価します。
実験とベンチマークは完全に再現性があり、https://github.com/ds4dh/cbms2025stratificationで入手できます。
要約(オリジナル)
Patient stratification identifying clinically meaningful subgroups is essential for advancing personalized medicine through improved diagnostics and treatment strategies. Electronic health records (EHRs), particularly those from intensive care units (ICUs), contain rich temporal clinical data that can be leveraged for this purpose. In this work, we introduce ICU-TSB (Temporal Stratification Benchmark), the first comprehensive benchmark for evaluating patient stratification based on temporal patient representation learning using three publicly available ICU EHR datasets. A key contribution of our benchmark is a novel hierarchical evaluation framework utilizing disease taxonomies to measure the alignment of discovered clusters with clinically validated disease groupings. In our experiments with ICU-TSB, we compared statistical methods and several recurrent neural networks, including LSTM and GRU, for their ability to generate effective patient representations for subsequent clustering of patient trajectories. Our results demonstrate that temporal representation learning can rediscover clinically meaningful patient cohorts; nevertheless, it remains a challenging task, with v-measuring varying from up to 0.46 at the top level of the taxonomy to up to 0.40 at the lowest level. To further enhance the practical utility of our findings, we also evaluate multiple strategies for assigning interpretable labels to the identified clusters. The experiments and benchmark are fully reproducible and available at https://github.com/ds4dh/CBMS2025stratification.
arxiv情報
著者 | Dimitrios Proios,Alban Bornet,Anthony Yazdani,Jose F Rodrigues Jr,Douglas Teodoro |
発行日 | 2025-06-06 15:52:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google