Functional Geometry Guided Protein Sequence and Backbone Structure Co-Design


この論文では、自動的に検出された機能部位に基づいてタンパク質の配列と構造を共同設計するモデルである NAEPro を提案します。
NAEPro は、アテンション層と等変層のインターリーブ ネットワークを利用しており、配列全体におけるグローバルな相関と、3 次元 (3D) 空間で最も近いアミノ酸からの局所的な影響を捕捉できます。
このようなアーキテクチャにより、2 つのレベルで効果的かつ経済的なメッセージ パッシングが容易になります。
$\beta$-lactamase と myoglobin という 2 つのタンパク質データセットに基づいてモデルといくつかの強力なベースラインを評価します。
実験結果は、当社のモデルがすべての競合他社の中で最高のアミノ酸回収率、TM スコア、および最低の RMSD を一貫して達成していることを示しています。
Github でコード、データ、モデルを提供します。


Proteins are macromolecules responsible for essential functions in almost all living organisms. Designing reasonable proteins with desired functions is crucial. A protein’s sequence and structure are strongly correlated and they together determine its function. In this paper, we propose NAEPro, a model to jointly design Protein sequence and structure based on automatically detected functional sites. NAEPro is powered by an interleaving network of attention and equivariant layers, which can capture global correlation in a whole sequence and local influence from nearest amino acids in three dimensional (3D) space. Such an architecture facilitates effective yet economic message passing at two levels. We evaluate our model and several strong baselines on two protein datasets, $\beta$-lactamase and myoglobin. Experimental results show that our model consistently achieves the highest amino acid recovery rate, TM-score, and the lowest RMSD among all competitors. These findings prove the capability of our model to design protein sequences and structures that closely resemble their natural counterparts. Furthermore, in-depth analysis further confirms our model’s ability to generate highly effective proteins capable of binding to their target metallocofactors. We provide code, data and models in Github.


著者 Zhenqiao Song,Yunlong Zhao,Wenxian Shi,Yang Yang,Lei Li
発行日 2023-10-06 16:08:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク