SCMPPI: Supervised Contrastive Multimodal Framework for Predicting Protein-Protein Interactions

要約

タンパク質間相互作用(PPI)予測は、細胞機能ネットワークや疾患メカニズムを解明する上で重要な課題である。しかし、従来の実験的手法は時間とコストがかかり、既存の計算モデルはクロスモーダル特徴融合、ロバスト性、偽陰性の抑制といった課題に直面している。本論文では、PPI予測のための新しい教師付き対比的マルチモーダルフレームワークSCMPPIを提案する。タンパク質配列特徴(AAC、DPC、CKSAAP-ESMC)とPPIネットワークトポロジー情報(Node2Vecグラフ埋め込み)を統合し、改良された教師付き対比学習戦略を組み合わせることで、SCMPPIはPPI予測性能を大幅に向上させる。PPIタスクに対して、SCMPPIは負のサンプルフィルタリングメカニズムを導入し、コントラスト損失関数を修正することで、マルチモーダル特徴を効果的に最適化する。酵母、ヒト、ピロリ菌を含む8つのベンチマークデータセットを用いた実験により、SCMPPIは、精度(98.01%)やAUC(99.62%)などの主要な指標において、既存の最先端手法(DF-PPIやTAGPPIなど)を凌駕し、種を超えた予測において強力な汎化性を示すことが示された(複数種のデータセットにおいてAUC > 99%)。さらに、SCMPPIはCD9ネットワーク、Wnt経路、および癌特異的ネットワークへの適用に成功しており、疾患標的探索のための信頼性の高いツールを提供している。また、このフレームワークは、マルチモーダルな生物学的情報の融合と、様々な組み合わせ予測のための協調最適化における対比学習のための新しいパラダイムを提供する。

要約(オリジナル)

Protein-Protein Interaction (PPI) prediction is a key task in uncovering cellular functional networks and disease mechanisms. However, traditional experimental methods are time-consuming and costly, and existing computational models face challenges in cross-modal feature fusion, robustness, and false-negative suppression. In this paper, we propose a novel supervised contrastive multimodal framework, SCMPPI, for PPI prediction. By integrating protein sequence features (AAC, DPC, CKSAAP-ESMC) with PPI network topology information (Node2Vec graph embedding), and combining an improved supervised contrastive learning strategy, SCMPPI significantly enhances PPI prediction performance. For the PPI task, SCMPPI introduces a negative sample filtering mechanism and modifies the contrastive loss function, effectively optimizing multimodal features. Experiments on eight benchmark datasets, including yeast, human, and H.pylori, show that SCMPPI outperforms existing state-of-the-art methods (such as DF-PPI and TAGPPI) in key metrics such as accuracy ( 98.01%) and AUC (99.62%), and demonstrates strong generalization in cross-species prediction (AUC > 99% on multi-species datasets). Furthermore, SCMPPI has been successfully applied to CD9 networks, the Wnt pathway, and cancer-specific networks, providing a reliable tool for disease target discovery. This framework also offers a new paradigm for multimodal biological information fusion and contrastive learning in collaborative optimization for various combined predictions.

arxiv情報

著者 Shengrui XU,Tianchi Lu,Zikun Wang,Jixiu Zhai,Jingwan Wang
発行日 2025-04-03 15:34:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68T07, 92C40, cs.AI, cs.LG, I.2.6, q-bio.QM パーマリンク