要約
電子医療記録 (EHR) での機械学習と AI の使用には、臨床上の洞察が得られる大きな可能性があります。
ただし、このアプローチは、データの異質性、まばらさ、時間的な不整合、および限定されたラベル付き結果による課題に直面しています。
これに関連して、英国のブリストル、ノースサマセット、サウスグロスターシャーの匿名化された約 100 万人の個人からなるリンクされた EHR データセットを活用して、尿路感染症 (UTI) を特徴付けます。
私たちは、生の EHR データを、データの公平性、説明責任、透明性に焦点を当てた予測モデルの開発に適した構造化形式に変換する、データ前処理およびキュレーション パイプラインを実装しました。
グラウンドトゥルースのUTI結果の入手可能性が限られていることと偏りがあることを考慮して、臨床専門知識に基づいたUTIリスク推定フレームワークを導入して、個々の患者のタイムライン全体でUTIリスクを推定します。
ペアワイズ XGBoost モデルは、このフレームワークを使用してトレーニングされ、主要な予測因子を特定し、解釈可能性をサポートするために適用される説明可能な AI 技術を使用して UTI リスク カテゴリを区別します。
私たちの調査結果は、リスクグループ間の臨床予測因子と人口統計予測因子の違いを明らかにしました。
この研究は、UTIの臨床意思決定をサポートするAI主導の洞察の可能性を強調していますが、臨床現場での堅牢性と適用性を確保するには、患者の基礎層のさらなる調査と広範な検証が必要です。
要約(オリジナル)
The use of machine learning and AI on electronic health records (EHRs) holds substantial potential for clinical insight. However, this approach faces challenges due to data heterogeneity, sparsity, temporal misalignment, and limited labeled outcomes. In this context, we leverage a linked EHR dataset of approximately one million de-identified individuals from Bristol, North Somerset, and South Gloucestershire, UK, to characterize urinary tract infections (UTIs). We implemented a data pre-processing and curation pipeline that transforms the raw EHR data into a structured format suitable for developing predictive models focused on data fairness, accountability and transparency. Given the limited availability and biases of ground truth UTI outcomes, we introduce a UTI risk estimation framework informed by clinical expertise to estimate UTI risk across individual patient timelines. Pairwise XGBoost models are trained using this framework to differentiate UTI risk categories with explainable AI techniques applied to identify key predictors and support interpretability. Our findings reveal differences in clinical and demographic predictors across risk groups. While this study highlights the potential of AI-driven insights to support UTI clinical decision-making, further investigation of patient sub-strata and extensive validation are needed to ensure robustness and applicability in clinical practice.
arxiv情報
著者 | Yujie Dai,Brian Sullivan,Axel Montout,Amy Dillon,Chris Waller,Peter Acs,Rachel Denholm,Philip Williams,Alastair D Hay,Raul Santos-Rodriguez,Andrew Dowsey |
発行日 | 2025-01-13 16:01:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google