Fast and Interpretable Mortality Risk Scores for Critical Care Patients


集中治療室 (ICU) 患者の死亡率の予測は、通常、ブラック ボックス モデル (病院での使用が許容されない) または手動で調整された解釈可能なモデル (パフォーマンスの低下につながる可能性があります) に依存します。
私たちは、最新の解釈可能な ML 技術に基づいて、ブラック ボックスと同じくらい正確な解釈可能な死亡リスク スコアを設計することで、これら 2 つのカテゴリ間のギャップを埋めることを目指しています。
私たちは、新しいアルゴリズム GroupFasterRisk を開発しました。これには、いくつかの重要な利点があります。ハードおよびソフトの両方の直接スパース正則化を使用し、グループ スパース性を組み込んでより一貫性のあるモデルを可能にし、単調性制約にドメイン知識を含めることができ、多数の均等なスパース性を生成します。
評価には、既存の最大の公共 ICU モニタリング データセット (MIMIC III および eICU) を活用しました。
GroupFasterRisk によって生成されたモデルは、パラメータの最大 3 分の 1 を使用しているにもかかわらず、OASIS および SAPS II のスコアを上回り、APACHE IV/IVa と同様のパフォーマンスを示しました。
敗血症/敗血症、急性心筋梗塞、心不全、急性腎不全の患者では、GroupFasterRisk モデルが OASIS および SOFA を上回りました。
最後に、OASIS 変数と比較して、GroupFasterRisk によって選択された変数に基づいて、さまざまな死亡率予測 ML アプローチのパフォーマンスが向上しました。
GroupFasterRisk のモデルは、桁違いにスパースであるにもかかわらず、現在病院で使用されているリスク スコアよりも優れたパフォーマンスを示し、ブラック ボックス ML モデルと同等でした。
GroupFasterRisk はさまざまなリスク スコアを生成するため、設計の柔軟性が可能になり、実用的なモデルの作成を可能にする重要な要素となります。
GroupFasterRisk は、死亡率予測のための多様な疎リスク スコアのセットを学習できる、高速でアクセスしやすい柔軟な手順です。


Prediction of mortality in intensive care unit (ICU) patients typically relies on black box models (that are unacceptable for use in hospitals) or hand-tuned interpretable models (that might lead to the loss in performance). We aim to bridge the gap between these two categories by building on modern interpretable ML techniques to design interpretable mortality risk scores that are as accurate as black boxes. We developed a new algorithm, GroupFasterRisk, which has several important benefits: it uses both hard and soft direct sparsity regularization, it incorporates group sparsity to allow more cohesive models, it allows for monotonicity constraint to include domain knowledge, and it produces many equally-good models, which allows domain experts to choose among them. For evaluation, we leveraged the largest existing public ICU monitoring datasets (MIMIC III and eICU). Models produced by GroupFasterRisk outperformed OASIS and SAPS II scores and performed similarly to APACHE IV/IVa while using at most a third of the parameters. For patients with sepsis/septicemia, acute myocardial infarction, heart failure, and acute kidney failure, GroupFasterRisk models outperformed OASIS and SOFA. Finally, different mortality prediction ML approaches performed better based on variables selected by GroupFasterRisk as compared to OASIS variables. GroupFasterRisk’s models performed better than risk scores currently used in hospitals, and on par with black box ML models, while being orders of magnitude sparser. Because GroupFasterRisk produces a variety of risk scores, it allows design flexibility – the key enabler of practical model creation. GroupFasterRisk is a fast, accessible, and flexible procedure that allows learning a diverse set of sparse risk scores for mortality prediction.


著者 Chloe Qinyu Zhu,Muhang Tian,Lesia Semenova,Jiachang Liu,Jack Xu,Joseph Scarpa,Cynthia Rudin
発行日 2025-01-08 17:14:40+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.CY, cs.LG パーマリンク