要約
大規模な言語モデル(LLMS)と知識グラフを使用したアルツハイマー病(AD)の研究に断片化されたマルチモーダルデータを統合するための新しいフレームワークを提案します。
従来のマルチモーダル分析では、データセット全体で一致する患者IDが必要ですが、私たちのアプローチでは、MRI、遺伝子発現、バイオマーカー、EEG、および独立コホートからの臨床指標の人口レベルの統合が示されています。
統計分析では、知識グラフのノードとして接続された各モダリティの重要な機能を特定しました。
次に、LLMSはグラフを分析して潜在的な相関を抽出し、自然言語で仮説を生成しました。
このアプローチは、代謝リスク因子を神経炎症(r> 0.6、p <0.001)を介したタウタンパク質の異常を結びつける潜在的な経路、および正面EEGチャネルと特定の遺伝子発現プロファイルとの予期しない相関(r = 0.42-0.58、p <0.01)を含む、いくつかの新しい関係を明らかにしました。
独立したデータセットとの相互検証により、主要な発見の堅牢性が確認され、コホート全体で一貫した効果サイズがあります(分散<15%)。
これらの調査結果の再現性は、専門家のレビュー(CohenのK = 0.82)および計算検証によってさらにサポートされていました。
私たちのフレームワークにより、患者IDマッチングを必要とせずに概念的レベルでクロスモーダル統合が可能になり、断片化されたデータの再利用と将来の研究のためのテスト可能な仮説を生成することにより、広告の病理を理解するための新しい可能性を提供します。
要約(オリジナル)
We propose a novel framework for integrating fragmented multi-modal data in Alzheimer’s disease (AD) research using large language models (LLMs) and knowledge graphs. While traditional multimodal analysis requires matched patient IDs across datasets, our approach demonstrates population-level integration of MRI, gene expression, biomarkers, EEG, and clinical indicators from independent cohorts. Statistical analysis identified significant features in each modality, which were connected as nodes in a knowledge graph. LLMs then analyzed the graph to extract potential correlations and generate hypotheses in natural language. This approach revealed several novel relationships, including a potential pathway linking metabolic risk factors to tau protein abnormalities via neuroinflammation (r>0.6, p<0.001), and unexpected correlations between frontal EEG channels and specific gene expression profiles (r=0.42-0.58, p<0.01). Cross-validation with independent datasets confirmed the robustness of major findings, with consistent effect sizes across cohorts (variance <15%). The reproducibility of these findings was further supported by expert review (Cohen's k=0.82) and computational validation. Our framework enables cross modal integration at a conceptual level without requiring patient ID matching, offering new possibilities for understanding AD pathology through fragmented data reuse and generating testable hypotheses for future research.
arxiv情報
著者 | Kanan Kiguchi,Yunhao Tu,Katsuhiro Ajito,Fady Alnajjar,Kazuyuki Murase |
発行日 | 2025-05-22 03:58:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google