Unsupervised Discovery of Clinical Disease Signatures Using Probabilistic Independence

要約

臨床疾患の正確な診断が不十分であると、一般的な症状や治療であっても、多くの治療失敗の原因となる可能性があります。
十分に大きなデータセットがあれば、教師なし機械学習を使用して臨床疾患のパターンをより正確に定義できる可能性があります。
我々は、確率的独立性を利用して、潜在的な病気の原因の医療記録上の痕跡を解きほぐすことで、これらのパターンを学習するアプローチを提案します。
私たちは、269,099 件の電子医療記録の 9,195 件の変数から、潜在的な情報源の 2,000 件の臨床的特徴の広範なセットを推定しました。
学習されたシグネチャは、推論アルゴリズムに未知の肺がん予測タスクにおいて元の変数よりも優れた識別をもたらし、孤立性肺結節が発見される前にがん歴のない患者の 3 年間の悪性腫瘍を予測しました。
さらに重要なことは、シグネチャのより大きな説明力により、これらの患者の多くにおいて、明らかに未診断の癌の結節形成前のシグネチャが特定されたことである。

要約(オリジナル)

Insufficiently precise diagnosis of clinical disease is likely responsible for many treatment failures, even for common conditions and treatments. With a large enough dataset, it may be possible to use unsupervised machine learning to define clinical disease patterns more precisely. We present an approach to learning these patterns by using probabilistic independence to disentangle the imprint on the medical record of causal latent sources of disease. We inferred a broad set of 2000 clinical signatures of latent sources from 9195 variables in 269,099 Electronic Health Records. The learned signatures produced better discrimination than the original variables in a lung cancer prediction task unknown to the inference algorithm, predicting 3-year malignancy in patients with no history of cancer before a solitary lung nodule was discovered. More importantly, the signatures’ greater explanatory power identified pre-nodule signatures of apparently undiagnosed cancer in many of those patients.

arxiv情報

著者 Thomas A. Lasko,John M. Still,Thomas Z. Li,Marco Barbero Mota,William W. Stead,Eric V. Strobl,Bennett A. Landman,Fabien Maldonado
発行日 2024-02-08 16:41:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, I.2.1, stat.AP, stat.ML パーマリンク