Explainable AI model reveals disease-related mechanisms in single-cell RNA-seq data


単核 RNA シークエンシング (snRNA-seq) によるデータ解析の利用が増加しているため、単細胞レベルでのトランスクリプトーム イベントの探索が可能になりますが、疾患の根底にあるメカニズムを解釈する際には課題に直面しています。
一方、ニューラル ネットワーク (NN) モデルは、複雑なデータを処理して洞察を提供できますが、解釈性が低いブラック ボックスとして見なされる場合があります。
この文脈において、Explainable AI (XAI) は、効率的な NN モデルと組み合わせることで、疾患に関連するメカニズムの理解に役立つソリューションとして登場します。
ただし、単一細胞データにおける XAI を調査する研究は限られています。
私たちは、利用可能なハンチントン病 (HD) データを分析し、差次的遺伝子発現解析 (DGE) と SHAP アプローチと組み合わせた NN という 2 つの方法を比較する遺伝子セット濃縮解析 (GSEA) を追加することで、HD によって変化する遺伝子とメカニズムの両方を特定します。


Neurodegenerative diseases (NDDs) are complex and lack effective treatment due to their poorly understood mechanism. The increasingly used data analysis from Single nucleus RNA Sequencing (snRNA-seq) allows to explore transcriptomic events at a single cell level, yet face challenges in interpreting the mechanisms underlying a disease. On the other hand, Neural Network (NN) models can handle complex data to offer insights but can be seen as black boxes with poor interpretability. In this context, explainable AI (XAI) emerges as a solution that could help to understand disease-associated mechanisms when combined with efficient NN models. However, limited research explores XAI in single-cell data. In this work, we implement a method for identifying disease-related genes and the mechanistic explanation of disease progression based on NN model combined with SHAP. We analyze available Huntington’s disease (HD) data to identify both HD-altered genes and mechanisms by adding Gene Set Enrichment Analysis (GSEA) comparing two methods, differential gene expression analysis (DGE) and NN combined with SHAP approach. Our results show that DGE and SHAP approaches offer both common and differential sets of altered genes and pathways, reinforcing the usefulness of XAI methods for a broader perspective of disease.


著者 Mohammad Usman,Olga Varea,Petia Radeva,Josep Canals,Jordi Abante,Daniel Ortiz
発行日 2025-01-07 16:35:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, q-bio.GN パーマリンク