Joint Masked Reconstruction and Contrastive Learning for Mining Interactions Between Proteins

要約

タンパク質間相互作用(PPI)予測は、細胞操作の根底にあるメカニズムの解明における手段の手段であり、製薬開発と臨床治療の領域に大きな実際的な意味を保持しています。
現在、研究方法の大部分は主にアミノ酸配列の分析に集中していますが、タンパク質構造に基づいた調査は、調査の初期段階に残っています。
近年のいくつかの構造ベースのアルゴリズムの出現にもかかわらず、これらはまだ固有の課題に直面しています。(1)タンパク質の固有の構造情報の抽出は、通常、実質的な計算リソースの支出を必要とします。
(2)これらのモデルは、見られたタンパク質データに過度に依存しており、未知のタンパク質間の相互作用の手がかりを効果的に発掘するのに苦労しています。
このドメインの進歩をさらに推進するために、このペーパーでは、JMCPPIと呼ばれるマスクされた再構築と対照学習を結合する新しいPPI予測方法を紹介します。
この方法論は、PPI予測タスクを2つの異なる位相に分析します。残基構造エンコーディングフェーズ中に、JMCPPIは2つの特徴再構成タスクを考案し、グラフ注意メカニズムを使用して残基間の構造情報をキャプチャします。
タンパク質相互作用の推論段階で、JMCPPIは元のPPIグラフを抑制し、新規タンパク質の外因性相互作用情報を徹底的に採掘するためのマルチグラフ対照学習戦略を採用しています。
広く利用されている3つのPPIデータセットで実施された広範な実験は、JMCPPIがさまざまなデータパーティションスキームにわたって既存の最適なベースラインモデルを上回ることを示しています。
関連するコードは、https://github.com/lijfrank-open/jmcppiからアクセスできます。

要約(オリジナル)

Protein-protein interaction (PPI) prediction is an instrumental means in elucidating the mechanisms underlying cellular operations, holding significant practical implications for the realms of pharmaceutical development and clinical treatment. Presently, the majority of research methods primarily concentrate on the analysis of amino acid sequences, while investigations predicated on protein structures remain in the nascent stages of exploration. Despite the emergence of several structure-based algorithms in recent years, these are still confronted with inherent challenges: (1) the extraction of intrinsic structural information of proteins typically necessitates the expenditure of substantial computational resources; (2) these models are overly reliant on seen protein data, struggling to effectively unearth interaction cues between unknown proteins. To further propel advancements in this domain, this paper introduces a novel PPI prediction method jointing masked reconstruction and contrastive learning, termed JmcPPI. This methodology dissects the PPI prediction task into two distinct phases: during the residue structure encoding phase, JmcPPI devises two feature reconstruction tasks and employs graph attention mechanism to capture structural information between residues; during the protein interaction inference phase, JmcPPI perturbs the original PPI graph and employs a multi-graph contrastive learning strategy to thoroughly mine extrinsic interaction information of novel proteins. Extensive experiments conducted on three widely utilized PPI datasets demonstrate that JmcPPI surpasses existing optimal baseline models across various data partition schemes. The associated code can be accessed via https://github.com/lijfrank-open/JmcPPI.

arxiv情報

著者 Jiang Li,Xiaoping Wang
発行日 2025-03-06 17:39:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.ET, cs.LG パーマリンク