要約
機械学習 (ML) モデルは、臨床上の意思決定を自動化する上でますます重要になっています。
しかし、先行研究における明らかな見落としは、臨床現場における電子医療記録 (EMR) データのエラーや外れ値に対する適切な処理が欠如していることでした。
この見落としに対処し、臨床専門知識をドメイン制約としてシームレスに統合し、ML ワークフローで使用できる重要なメタデータを生成する革新的な投影ベースの手法を導入します。
特に、患者のバイタルや検査値に対する生理学的および生物学的制約を捕捉する高次元混合整数プログラムを使用することで、EMR データの数学的「投影」の力を利用して患者データを修正できます。
その結果、患者データの健全な範囲を定義する制約から修正データまでの距離を測定し、「信頼スコア」と呼ぶ独自の予測指標が得られます。
これらのスコアは患者の健康状態に関する洞察を提供し、実際の臨床現場での ML 分類器のパフォーマンスを大幅に向上させます。
私たちは、ML を使用した敗血症の早期検出という文脈でフレームワークの影響を検証します。
我々は、AUROC 0.865 と精度 0.922 を示しており、これは、そのような投影のない従来の ML モデルを上回っています。
要約(オリジナル)
Machine learning (ML) models are increasingly pivotal in automating clinical decisions. Yet, a glaring oversight in prior research has been the lack of proper processing of Electronic Medical Record (EMR) data in the clinical context for errors and outliers. Addressing this oversight, we introduce an innovative projections-based method that seamlessly integrates clinical expertise as domain constraints, generating important meta-data that can be used in ML workflows. In particular, by using high-dimensional mixed-integer programs that capture physiological and biological constraints on patient vitals and lab values, we can harness the power of mathematical ‘projections’ for the EMR data to correct patient data. Consequently, we measure the distance of corrected data from the constraints defining a healthy range of patient data, resulting in a unique predictive metric we term as ‘trust-scores’. These scores provide insight into the patient’s health status and significantly boost the performance of ML classifiers in real-life clinical settings. We validate the impact of our framework in the context of early detection of sepsis using ML. We show an AUROC of 0.865 and a precision of 0.922, that surpasses conventional ML models without such projections.
arxiv情報
著者 | Mehak Arora,Hassan Mortagy,Nathan Dwarshius,Swati Gupta,Andre L. Holder,Rishikesan Kamaleswaran |
発行日 | 2023-08-21 15:14:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google