要約
電子医療記録 (EHR) データを使用した動的予測モデリングは、近年大きな注目を集めています。
このようなモデルの信頼性と信頼性は、基礎となるデータの品質に大きく依存します。これは、モデル開発の前の段階、つまり EHR システムからのデータ抽出とデータの準備によって主に決まります。
これらの段階で遭遇する 40 以上の課題を列挙し、それらに対処するための実用的な推奨事項を提供します。
これらの課題は、コホートの定義、結果の定義、特徴エンジニアリング、データ クリーニングの 4 つのカテゴリに分類されます。
このリストは、データ抽出エンジニアや研究者にとって実践的なガイドとして機能するように設計されており、より良い実践をサポートし、臨床現場での動的予測モデルの品質と現実世界への適用性を向上させます。
要約(オリジナル)
Dynamic predictive modeling using electronic health record (EHR) data has gained significant attention in recent years. The reliability and trustworthiness of such models depend heavily on the quality of the underlying data, which is largely determined by the stages preceding the model development: data extraction from EHR systems and data preparation. We list over forty challenges encountered during these stages and provide actionable recommendations for addressing them. These challenges are organized into four categories: cohort definition, outcome definition, feature engineering, and data cleaning. This list is designed to serve as a practical guide for data extraction engineers and researchers, supporting better practices and improving the quality and real-world applicability of dynamic prediction models in clinical settings.
arxiv情報
著者 | Elena Albu,Shan Gao,Pieter Stijnen,Frank E. Rademakers,Bas C T van Bussel,Taya Collyer,Tina Hernandez-Boussard,Laure Wynants,Ben Van Calster |
発行日 | 2025-01-17 15:09:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google