Improved motif-scaffolding with SE(3) flow matching

要約

タンパク質の設計は、多くの場合、モチーフ足場がその周りに機能的なタンパク質を構築することを目的とするモチーフからの所望の機能の知識から始まる。
最近、生成モデルは、さまざまなモチーフの足場の設計において画期的な成功を収めています。
ただし、生成された足場は構造的多様性に欠ける傾向があり、ウェットラボ検証の成功を妨げる可能性があります。
この研究では、タンパク質バックボーン生成用の SE(3) フロー マッチング モデルである FrameFlow を拡張し、2 つの相補的なアプローチでモチーフ足場を実行します。
1 つ目はモチーフの償却です。これは、データ拡張戦略を使用して、入力としてモチーフを使用して FrameFlow をトレーニングします。
2 つ目はモチーフ ガイダンスです。これは、FrameFlow からの条件付きスコアの推定値を使用してスキャフォールディングを実行し、追加のトレーニングを必要としません。
どちらのアプローチも、構造的に 2.5 倍多様な足場を使用して、以前の最先端の方法と同等以上の成功率を達成します。
コード: https://github.com/microsoft/frame-flow。

要約(オリジナル)

Protein design often begins with knowledge of a desired function from a motif which motif-scaffolding aims to construct a functional protein around. Recently, generative models have achieved breakthrough success in designing scaffolds for a diverse range of motifs. However, the generated scaffolds tend to lack structural diversity, which can hinder success in wet-lab validation. In this work, we extend FrameFlow, an SE(3) flow matching model for protein backbone generation, to perform motif-scaffolding with two complementary approaches. The first is motif amortization, in which FrameFlow is trained with the motif as input using a data augmentation strategy. The second is motif guidance, which performs scaffolding using an estimate of the conditional score from FrameFlow, and requires no additional training. Both approaches achieve an equivalent or higher success rate than previous state-of-the-art methods, with 2.5 times more structurally diverse scaffolds. Code: https://github.com/ microsoft/frame-flow.

arxiv情報

著者 Jason Yim,Andrew Campbell,Emile Mathieu,Andrew Y. K. Foong,Michael Gastegger,José Jiménez-Luna,Sarah Lewis,Victor Garcia Satorras,Bastiaan S. Veeling,Frank Noé,Regina Barzilay,Tommi S. Jaakkola
発行日 2024-01-08 18:38:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM, stat.ML パーマリンク