Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates

要約

酵素は、化学反応を促進することができる、遺伝的にコード化された生体触媒です。
機能的な酵素を自動的に設計するにはどうすればよいでしょうか?
この論文では、すべての機能ファミリーにわたる酵素を設計するための統一モデルを学習するアプローチである EnzyGen を提案します。
私たちの重要なアイデアは、機能的に重要な部位と、目的の触媒機能に対応する基質に基づいて、酵素のアミノ酸配列とその三次元 (3D) 座標を生成することです。
これらのサイトは酵素データベースから自動的にマイニングされます。
EnzyGen は、アテンション層と近傍等変層の新しいインターリーブ ネットワークで構成されており、タンパク質配列全体の長距離相関と 3D 空間で最も近いアミノ酸からの局所的な影響の両方を捕捉します。
生成モデルを学習するために、配列生成の損失、位置予測の損失、酵素と基質の相互作用の損失を含む共同トレーニング目標を考案します。
さらに、タンパク質データバンク (PDB) 内の利用可能なすべての酵素をカバーする、3157 の酵素ファミリーを含むデータセットである EnzyBench を構築します。
実験結果は、当社の EnzyGen が 323 のテストファミリーすべてにわたって一貫して最高のパフォーマンスを達成し、基質結合親和性の点で最高のベースラインを 10.79% 上回っていることを示しています。
これらの発見は、高い親和性で特定の基質に結合する、よく折り畳まれた効果的な酵素を設計する際の EnzyGen の優れた能力を示しています。

要約(オリジナル)

Enzymes are genetically encoded biocatalysts capable of accelerating chemical reactions. How can we automatically design functional enzymes? In this paper, we propose EnzyGen, an approach to learn a unified model to design enzymes across all functional families. Our key idea is to generate an enzyme’s amino acid sequence and their three-dimensional (3D) coordinates based on functionally important sites and substrates corresponding to a desired catalytic function. These sites are automatically mined from enzyme databases. EnzyGen consists of a novel interleaving network of attention and neighborhood equivariant layers, which captures both long-range correlation in an entire protein sequence and local influence from nearest amino acids in 3D space. To learn the generative model, we devise a joint training objective, including a sequence generation loss, a position prediction loss and an enzyme-substrate interaction loss. We further construct EnzyBench, a dataset with 3157 enzyme families, covering all available enzymes within the protein data bank (PDB). Experimental results show that our EnzyGen consistently achieves the best performance across all 323 testing families, surpassing the best baseline by 10.79% in terms of substrate binding affinity. These findings demonstrate EnzyGen’s superior capability in designing well-folded and effective enzymes binding to specific substrates with high affinities.

arxiv情報

著者 Zhenqiao Song,Yunlong Zhao,Wenxian Shi,Wengong Jin,Yang Yang,Lei Li
発行日 2024-07-17 15:14:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク