LASSO-MOGAT: A Multi-Omics Graph Attention Framework for Cancer Classification

要約

遺伝子発現パターンの変化を分析するための機械学習手法の応用は、最近、がん研究における強力なアプローチとして浮上しており、がんの発症と進行を支える分子機構についての理解が深まりました。
遺伝子発現データと他のタイプのオミクスデータを組み合わせることで、がん分類の結果が改善されることが多くの研究で報告されています。
これらの進歩にもかかわらず、高次元のマルチオミクスデータを効果的に統合し、さまざまな生物学的層にわたる複雑な関係を捕捉することは依然として困難です。
この論文では、メッセンジャー RNA、マイクロ RNA、および DNA メチル化データを統合して 31 種類のがんを分類する、新しいグラフベースの深層学習フレームワークである LASSO-MOGAT (LASSO-Multi-Omics Gated ATtention) を紹介します。
LASSO-MOGAT は、特徴選択に LIMMA および LASSO 回帰による差次的発現解析を利用し、グラフ アテンション ネットワーク (GAT) を活用してタンパク質間相互作用 (PPI) ネットワークを組み込むことで、マルチオミクス データ内の複雑な関係を効果的に捕捉します。
5 分割交差検証を使用した実験的検証により、この方法の精度、信頼性、およびがんの分子機構に関する包括的な洞察を提供する能力が実証されました。
タンパク質間相互作用に基づいて提案されたグラフ注意アーキテクチャによるグラフのエッジの注意係数の計算は、がん分類のためのマルチオミクスデータの相乗効果を特定するのに有益であることが証明されました。

要約(オリジナル)

The application of machine learning methods to analyze changes in gene expression patterns has recently emerged as a powerful approach in cancer research, enhancing our understanding of the molecular mechanisms underpinning cancer development and progression. Combining gene expression data with other types of omics data has been reported by numerous works to improve cancer classification outcomes. Despite these advances, effectively integrating high-dimensional multi-omics data and capturing the complex relationships across different biological layers remains challenging. This paper introduces LASSO-MOGAT (LASSO-Multi-Omics Gated ATtention), a novel graph-based deep learning framework that integrates messenger RNA, microRNA, and DNA methylation data to classify 31 cancer types. Utilizing differential expression analysis with LIMMA and LASSO regression for feature selection, and leveraging Graph Attention Networks (GATs) to incorporate protein-protein interaction (PPI) networks, LASSO-MOGAT effectively captures intricate relationships within multi-omics data. Experimental validation using five-fold cross-validation demonstrates the method’s precision, reliability, and capacity for providing comprehensive insights into cancer molecular mechanisms. The computation of attention coefficients for the edges in the graph by the proposed graph-attention architecture based on protein-protein interactions proved beneficial for identifying synergies in multi-omics data for cancer classification.

arxiv情報

著者 Fadi Alharbi,Aleksandar Vakanski,Murtada K. Elbashir,Mohanad Mohammed
発行日 2024-08-30 16:26:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68, cs.LG パーマリンク