要約
【タイトル】CoGANPPIS: タンパク質間相互作用サイト予測のための共進化強化グローバルアテンションニューラルネットワーク
【要約】
-タンパク質間相互作用は生化学プロセスで本質的です。
-タンパク質間相互作用サイト(PPI)の正確な予測は生物学的なメカニズムの理解を深め、新しい薬剤設計に不可欠です。
-しかし、PPI予測の従来の実験的方法はコストがかかり、時間がかかるため、最近は多くのMLベースの方法が開発されています。
-これらのアプローチは満足のいく結果を示したが、2つの制限がある。
1.ほとんどのモデルは有用な入力機能を発掘したが、共進化的機能を考慮に入れることに失敗し、それは残留間関係の手がかりを提供する可能性がある。
2.アテンションベースのモデルは、隣接する残基にのみアテンション重みを割り当てるだけで、遠くにある残基の重要性を無視しています。
-CoGANPPISはPPI予測のためのシーケンスベースの深層学習モデルです。
-特徴抽出には3つのレイヤーを並列して使用しています。
1.隣接残基の特徴を集計するローカルレベル表現集約レイヤー。
2.同じタンパク質配列上のすべての残基にアテンションウェイトを割り当てる新しい共進化強化グローバルアテンションメカニズムを使用するグローバルレベル表現学習レイヤー。
3.CNN&プーリングを共進化情報に適用して、共進化プロファイル表現を取得する共進化情報学習レイヤー。
-次に、3つの出力を連結して、最終的な予測用にいくつかの完全に接続されたレイヤーに渡されます。
-2つのベンチマークデータセットでのアプリケーションにより、当社のモデルの最新のパフォーマンスが実証されました。
-ソースコードはhttps://github.com/Slam1423/CoGANPPIS_source_codeで公開されています。
要約(オリジナル)
Protein-protein interactions are essential in biochemical processes. Accurate prediction of the protein-protein interaction sites (PPIs) deepens our understanding of biological mechanism and is crucial for new drug design. However, conventional experimental methods for PPIs prediction are costly and time-consuming so that many computational approaches, especially ML-based methods, have been developed recently. Although these approaches have achieved gratifying results, there are still two limitations: (1) Most models have excavated some useful input features, but failed to take coevolutionary features into account, which could provide clues for inter-residue relationships; (2) The attention-based models only allocate attention weights for neighboring residues, instead of doing it globally, neglecting that some residues being far away from the target residues might also matter. We propose a coevolution-enhanced global attention neural network, a sequence-based deep learning model for PPIs prediction, called CoGANPPIS. It utilizes three layers in parallel for feature extraction: (1) Local-level representation aggregation layer, which aggregates the neighboring residues’ features; (2) Global-level representation learning layer, which employs a novel coevolution-enhanced global attention mechanism to allocate attention weights to all the residues on the same protein sequences; (3) Coevolutionary information learning layer, which applies CNN & pooling to coevolutionary information to obtain the coevolutionary profile representation. Then, the three outputs are concatenated and passed into several fully connected layers for the final prediction. Application on two benchmark datasets demonstrated a state-of-the-art performance of our model. The source code is publicly available at https://github.com/Slam1423/CoGANPPIS_source_code.
arxiv情報
| 著者 | Jiaxing Guo,Xuening Zhu,Zixin Hu,Xiaoxi Hu |
| 発行日 | 2023-04-03 07:17:02+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI