Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model

要約

酵素工学により、触媒活性、安定性、結合親和性、その他の特性を強化することで、産業および研究の需要を満たす野生型タンパク質の修飾が可能になります。
タンパク質モデリングのための深層学習手法の出現により、指向進化や合理的設計などの従来のアプローチと比較して、低コストで優れた結果が得られることが実証されました。
突然変異の影響予測において、深層学習モデルを事前トレーニングする鍵は、タンパク質の配列、構造、機能の間の複雑な関係を正確に解釈することにあります。
この研究では、配列と局所構造相互作用からのネイティブ特性、および検索された相同配列からの進化的特性を包括的に分析するための検索強化タンパク質言語モデルを導入します。
提案された ProtREM の最先端のパフォーマンスは、オープン ベンチマーク (ProteinGym) による 217 のアッセイにわたって 200 万を超える変異体で検証されています。
また、VHH 抗体の安定性と結合親和性を向上させるモデルの能力の事後分析も実施しました。
さらに、我々は DNA ポリメラーゼ上で 10 の新しい変異体を設計し、高温での活性の増強を評価するためにウェットラボ実験を実施しました。
インシリコ評価と実験評価の両方で、私たちの方法が突然変異の影響の信頼できる予測を提供し、既存の酵素の進化を目指す生物学者に補助ツールを提供することが確認されました。
この実装は https://github.com/tyang816/ProtREM で公開されています。

要約(オリジナル)

Enzyme engineering enables the modification of wild-type proteins to meet industrial and research demands by enhancing catalytic activity, stability, binding affinities, and other properties. The emergence of deep learning methods for protein modeling has demonstrated superior results at lower costs compared to traditional approaches such as directed evolution and rational design. In mutation effect prediction, the key to pre-training deep learning models lies in accurately interpreting the complex relationships among protein sequence, structure, and function. This study introduces a retrieval-enhanced protein language model for comprehensive analysis of native properties from sequence and local structural interactions, as well as evolutionary properties from retrieved homologous sequences. The state-of-the-art performance of the proposed ProtREM is validated on over 2 million mutants across 217 assays from an open benchmark (ProteinGym). We also conducted post-hoc analyses of the model’s ability to improve the stability and binding affinity of a VHH antibody. Additionally, we designed 10 new mutants on a DNA polymerase and conducted wet-lab experiments to evaluate their enhanced activity at higher temperatures. Both in silico and experimental evaluations confirmed that our method provides reliable predictions of mutation effects, offering an auxiliary tool for biologists aiming to evolve existing enzymes. The implementation is publicly available at https://github.com/tyang816/ProtREM.

arxiv情報

著者 Yang Tan,Ruilin Wang,Banghao Wu,Liang Hong,Bingxin Zhou
発行日 2024-10-28 15:28:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, q-bio.QM パーマリンク