Self-explainable Graph Neural Network for Alzheimer’s Disease And Related Dementias Risk Prediction

要約

背景: アルツハイマー病および関連認知症 (ADRD) は米国の死因の第 6 位にランクされており、正確な ADRD リスク予測の重要性が強調されています。
ADRD のリスク予測における最近の進歩は主に画像解析に依存していますが、ADRD の診断前にすべての患者が医療画像検査を受けているわけではありません。
機械学習と請求データを統合すると、さらなるリスク要因が明らかになり、多様な医療コード間の相互関係が明らかになる可能性があります。
目的: 私たちの目標は、ADRD リスク予測のために請求データを含むグラフ ニューラル ネットワーク (GNN) を利用することです。
これらの予測の背後に人間が解釈できる理由がないことに対処し、関係の重要性とADRDリスク予測に対するその影響を評価し、包括的な解釈を保証する革新的な方法を導入します。
方法: ADRD 尤度を推定するために、変分正則化エンコーダー デコーダー グラフ ニューラル ネットワーク (VGNN) を採用しました。
ランダム フォレストとライト グラディエント ブースト マシンをベースラインとして使用して、モデルの効率を評価する 3 つのシナリオを作成しました。
さらに、関係重要性手法を使用して、ADRD リスク予測の重要な関係を明確にしました。
結果: VGNN は、受信機動作特性の下の領域で他のベースライン モデルを 10% 上回りました。
GNN モデルと関係重要度の解釈の統合は、ADRD の進行に寄与する、または進行を遅らせる可能性のある要因についての貴重な洞察を提供する上で、重要な役割を果たす可能性があります。
結論: 請求データに対して GNN アプローチを採用すると、ADRD リスク予測が強化され、相互接続された医療コードの関係の影響についての洞察が得られます。
この方法論は、ADRD リスク モデリングを可能にするだけでなく、請求データを使用した他の画像分析予測の可能性も示します。

要約(オリジナル)

Background: Alzheimer’s disease and related dementias (ADRD) ranks as the sixth leading cause of death in the US, underlining the importance of accurate ADRD risk prediction. While recent advancement in ADRD risk prediction have primarily relied on imaging analysis, yet not all patients undergo medical imaging before an ADRD diagnosis. Merging machine learning with claims data can reveal additional risk factors and uncover interconnections among diverse medical codes. Objective: Our goal is to utilize Graph Neural Networks (GNNs) with claims data for ADRD risk prediction. Addressing the lack of human-interpretable reasons behind these predictions, we introduce an innovative method to evaluate relationship importance and its influence on ADRD risk prediction, ensuring comprehensive interpretation. Methods: We employed Variationally Regularized Encoder-decoder Graph Neural Network (VGNN) for estimating ADRD likelihood. We created three scenarios to assess the model’s efficiency, using Random Forest and Light Gradient Boost Machine as baselines. We further used our relation importance method to clarify the key relationships for ADRD risk prediction. Results: VGNN surpassed other baseline models by 10% in the area under the receiver operating characteristic. The integration of the GNN model and relation importance interpretation could potentially play an essential role in providing valuable insight into factors that may contribute to or delay ADRD progression. Conclusions: Employing a GNN approach with claims data enhances ADRD risk prediction and provides insights into the impact of interconnected medical code relationships. This methodology not only enables ADRD risk modeling but also shows potential for other image analysis predictions using claims data.

arxiv情報

著者 Xinyue Hu,Zenan Sun,Yi Nian,Yichen Wang,Yifang Dang,Fang Li,Jingna Feng,Evan Yu,Cui Tao
発行日 2024-06-10 16:29:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク