Inducing Causal Structure for Interpretable Neural Networks Applied to Glucose Prediction for T1DM Patients

要約

インターチェンジ介入トレーニング(IIT)などの因果的な抽象化技術は、神経ネットワークに因果モデルにエンコードされた専門知識を注入することが提案されていますが、実際の問題への適用は依然として限られています。
この記事では、1型糖尿病(T1DM)患者の血糖値を予測する際のIITの適用について説明します。
この研究では、FDAによって承認されたシングルコースシミュレーターの非環式バージョンを使用して、多層パーセプトロン(MLP)モデルを訓練し、IITを使用して因果関係を課しています。
結果は、IITで訓練されたモデルが因果構造を効果的に抽象化し、さまざまな予測範囲(PHS)後のさまざまな予測視野(PHS)にわたって予測パフォーマンスの観点から標準的な構造を上回ったことを示しています。
さらに、反事実上の損失の内訳を活用して、因果メカニズムのどの部分がモデルによってより効果的に捉えられているかを説明することができます。
これらの予備的な結果は、専門知識を効果的に遵守することにより、ヘルスケアの予測モデルを強化するIITの可能性を示唆しています。

要約(オリジナル)

Causal abstraction techniques such as Interchange Intervention Training (IIT) have been proposed to infuse neural network with expert knowledge encoded in causal models, but their application to real-world problems remains limited. This article explores the application of IIT in predicting blood glucose levels in Type 1 Diabetes Mellitus (T1DM) patients. The study utilizes an acyclic version of the simglucose simulator approved by the FDA to train a Multi-Layer Perceptron (MLP) model, employing IIT to impose causal relationships. Results show that the model trained with IIT effectively abstracted the causal structure and outperformed the standard one in terms of predictive performance across different prediction horizons (PHs) post-meal. Furthermore, the breakdown of the counterfactual loss can be leveraged to explain which part of the causal mechanism are more or less effectively captured by the model. These preliminary results suggest the potential of IIT in enhancing predictive models in healthcare by effectively complying with expert knowledge.

arxiv情報

著者 Ana Esponera,Giovanni Cinnà
発行日 2025-03-18 17:18:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク