要約
タンパク質間相互作用は、生化学プロセスに不可欠です。
タンパク質間相互作用部位 (PPI) の正確な予測は、生物学的メカニズムの理解を深め、新薬の設計に不可欠です。
ただし、PPI 予測のための従来の実験的方法はコストと時間がかかるため、多くの計算アプローチ、特に ML ベースの方法が最近開発されています。
これらのアプローチは満足のいく結果を達成しましたが、まだ 2 つの制限があります。(1) ほとんどのモデルは、いくつかの有用な入力機能を発掘しましたが、残基間の関係の手がかりを提供する可能性のある共進化機能を考慮に入れることができませんでした。
(2) 注意ベースのモデルは、グローバルに行うのではなく、近隣の残基にのみ注意の重みを割り当て、ターゲット残基から遠く離れているいくつかの残基も重要である可能性があることを無視します。
CoGANPPIS と呼ばれる、PPI 予測のためのシーケンスベースの深層学習モデルである、共進化によって強化されたグローバル アテンション ニューラル ネットワークを提案します。
特徴抽出のために3つのレイヤーを並行して利用します。(1)ローカルレベルの表現集約レイヤー。隣接する残基の特徴を集約します。
(2) グローバル レベルの表現学習層。これは、共進化によって強化された新しいグローバル アテンション メカニズムを使用して、同じタンパク質配列上のすべての残基にアテンション ウェイトを割り当てます。
(3) 共進化情報学習層。CNN とプーリングを共進化情報に適用して、共進化プロファイル表現を取得します。
次に、3 つの出力が連結され、最終的な予測のためにいくつかの完全に接続されたレイヤーに渡されます。
2 つのベンチマーク データセットへの適用により、モデルの最先端のパフォーマンスが実証されました。
ソース コードは、https://github.com/Slam1423/CoGANPPIS_source_code で公開されています。
要約(オリジナル)
Protein-protein interactions are essential in biochemical processes. Accurate prediction of the protein-protein interaction sites (PPIs) deepens our understanding of biological mechanism and is crucial for new drug design. However, conventional experimental methods for PPIs prediction are costly and time-consuming so that many computational approaches, especially ML-based methods, have been developed recently. Although these approaches have achieved gratifying results, there are still two limitations: (1) Most models have excavated some useful input features, but failed to take coevolutionary features into account, which could provide clues for inter-residue relationships; (2) The attention-based models only allocate attention weights for neighboring residues, instead of doing it globally, neglecting that some residues being far away from the target residues might also matter. We propose a coevolution-enhanced global attention neural network, a sequence-based deep learning model for PPIs prediction, called CoGANPPIS. It utilizes three layers in parallel for feature extraction: (1) Local-level representation aggregation layer, which aggregates the neighboring residues’ features; (2) Global-level representation learning layer, which employs a novel coevolution-enhanced global attention mechanism to allocate attention weights to all the residues on the same protein sequences; (3) Coevolutionary information learning layer, which applies CNN & pooling to coevolutionary information to obtain the coevolutionary profile representation. Then, the three outputs are concatenated and passed into several fully connected layers for the final prediction. Application on two benchmark datasets demonstrated a state-of-the-art performance of our model. The source code is publicly available at https://github.com/Slam1423/CoGANPPIS_source_code.
arxiv情報
著者 | Jiaxing Guo,Xuening Zhu,Zixin Hu,Xiaoxi Hu |
発行日 | 2023-03-28 15:34:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google