Advanced atom-level representations for protein flexibility prediction utilizing graph neural networks

要約

タンパク質の動態は、多くの生物学的プロセスや薬物相互作用において重要な役割を果たします。
ただし、タンパク質のダイナミクスの測定とシミュレーションは困難で時間がかかります。
機械学習は構造情報からタンパク質のダイナミクスの決定要因を解読するのに有望ですが、タンパク質表現学習のための既存の手法のほとんどは残基レベルで動作し、原子相互作用の詳細を無視しています。
この研究では、グラフ ニューラル ネットワーク (GNN) を使用して原子レベルでタンパク質の表現を学習し、タンパク質の 3D 構造から B 因子を予測することを初めて提案します。
B 因子はタンパク質内の原子の原子置換を反映し、タンパク質の柔軟性の代用として機能します。
さまざまな GNN アーキテクチャを比較して、そのパフォーマンスを評価しました。
Meta-GNN モデルは、タンパク質データ バンク (PDB) からの 4,000 を超えるタンパク質 (1,700 万個の原子) からなる大規模で多様なテスト セットで 0.71 の相関係数を達成し、以前の方法を大幅に上回りました。
私たちの研究は、タンパク質の柔軟性予測やその他の関連タスクのために GNN によって学習された表現の可能性を実証しています。

要約(オリジナル)

Protein dynamics play a crucial role in many biological processes and drug interactions. However, measuring, and simulating protein dynamics is challenging and time-consuming. While machine learning holds promise in deciphering the determinants of protein dynamics from structural information, most existing methods for protein representation learning operate at the residue level, ignoring the finer details of atomic interactions. In this work, we propose for the first time to use graph neural networks (GNNs) to learn protein representations at the atomic level and predict B-factors from protein 3D structures. The B-factor reflects the atomic displacement of atoms in proteins, and can serve as a surrogate for protein flexibility. We compared different GNN architectures to assess their performance. The Meta-GNN model achieves a correlation coefficient of 0.71 on a large and diverse test set of over 4k proteins (17M atoms) from the Protein Data Bank (PDB), outperforming previous methods by a large margin. Our work demonstrates the potential of representations learned by GNNs for protein flexibility prediction and other related tasks.

arxiv情報

著者 Sina Sarparast,Aldo Zaimi,Maximilian Ebert,Michael-Rock Goldsmith
発行日 2024-08-22 16:15:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク