Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates


この論文では、すべての機能ファミリーにわたる酵素を設計するための統一モデルを学習するアプローチである EnzyGen を提案します。
私たちの重要なアイデアは、機能的に重要な部位と、目的の触媒機能に対応する基質に基づいて、酵素のアミノ酸配列とその三次元 (3D) 座標を生成することです。
EnzyGen は、アテンション層と近傍等変層の新しいインターリーブ ネットワークで構成されており、タンパク質配列全体の長距離相関と 3D 空間で最も近いアミノ酸からの局所的な影響の両方を捕捉します。
さらに、タンパク質データバンク (PDB) 内の利用可能なすべての酵素をカバーする、3157 の酵素ファミリーを含むデータセットである EnzyBench を構築します。
実験結果は、当社の EnzyGen が 323 のテストファミリーすべてにわたって一貫して最高のパフォーマンスを達成し、基質結合親和性の点で最高のベースラインを 10.79% 上回っていることを示しています。
これらの発見は、高い親和性で特定の基質に結合する、よく折り畳まれた効果的な酵素を設計する際の EnzyGen の優れた能力を示しています。


Enzymes are genetically encoded biocatalysts capable of accelerating chemical reactions. How can we automatically design functional enzymes? In this paper, we propose EnzyGen, an approach to learn a unified model to design enzymes across all functional families. Our key idea is to generate an enzyme’s amino acid sequence and their three-dimensional (3D) coordinates based on functionally important sites and substrates corresponding to a desired catalytic function. These sites are automatically mined from enzyme databases. EnzyGen consists of a novel interleaving network of attention and neighborhood equivariant layers, which captures both long-range correlation in an entire protein sequence and local influence from nearest amino acids in 3D space. To learn the generative model, we devise a joint training objective, including a sequence generation loss, a position prediction loss and an enzyme-substrate interaction loss. We further construct EnzyBench, a dataset with 3157 enzyme families, covering all available enzymes within the protein data bank (PDB). Experimental results show that our EnzyGen consistently achieves the best performance across all 323 testing families, surpassing the best baseline by 10.79% in terms of substrate binding affinity. These findings demonstrate EnzyGen’s superior capability in designing well-folded and effective enzymes binding to specific substrates with high affinities.


著者 Zhenqiao Song,Yunlong Zhao,Wenxian Shi,Wengong Jin,Yang Yang,Lei Li
発行日 2024-07-17 15:14:32+00:00
