ForceGen: End-to-end de novo protein generation based on nonlinear mechanical unfolding responses using a language diffusion model

要約

自然は進化を通じて、メカノバイオロジーにおいて重要な役割を果たす優れた機械的性能を備えたエラスチン、シルク、ケラチン、コラーゲンなどの一連の注目すべきタンパク質材料を提供してきました。
しかし、自然の設計を超えて、指定された機械的特性を満たすタンパク質を発見することは依然として困難です。
今回我々は、複雑な非線形機械的特性設計目標を満たすタンパク質設計を予測する生成モデルを報告する。
私たちのモデルは、事前にトレーニングされたタンパク質言語モデルからのタンパク質配列に関する深い知識を活用し、機械的アンフォールディング応答をマッピングして新しいタンパク質を作成します。
直接検証のための全原子分子シミュレーションにより、設計したタンパク質が新規であり、展開エネルギーや機械的強度、詳細な展開力分離曲線などの目標とする機械的特性を満たすことを実証します。
私たちのモデルは、機械的特徴をターゲットとして使用して、生物学的合成に制約されない巨大な機械生物学的タンパク質配列空間を探索するための迅速な経路を提供し、優れた機械的特性を備えたタンパク質材料の発見を可能にします。

要約(オリジナル)

Through evolution, nature has presented a set of remarkable protein materials, including elastins, silks, keratins and collagens with superior mechanical performances that play crucial roles in mechanobiology. However, going beyond natural designs to discover proteins that meet specified mechanical properties remains challenging. Here we report a generative model that predicts protein designs to meet complex nonlinear mechanical property-design objectives. Our model leverages deep knowledge on protein sequences from a pre-trained protein language model and maps mechanical unfolding responses to create novel proteins. Via full-atom molecular simulations for direct validation, we demonstrate that the designed proteins are novel, and fulfill the targeted mechanical properties, including unfolding energy and mechanical strength, as well as the detailed unfolding force-separation curves. Our model offers rapid pathways to explore the enormous mechanobiological protein sequence space unconstrained by biological synthesis, using mechanical features as target to enable the discovery of protein materials with superior mechanical properties.

arxiv情報

著者 Bo Ni,David L. Kaplan,Markus J. Buehler
発行日 2023-12-14 12:24:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mes-hall, cond-mat.mtrl-sci, cs.CL, cs.LG, q-bio.BM パーマリンク