SE(3)-Stochastic Flow Matching for Protein Backbone Generation

要約

新しいタンパク質構造のコンピューターによる設計は、多くの科学分野に大きな影響を与える可能性があります。
この目標に向けて、$3\mathrm{D}$ の剛体運動、つまりグループ $\text{SE}(3)$ に対するフローマッチングパラダイムに基づいてモデリング能力を向上させる一連の新しい生成モデルである FoldFlow を導入します。
— タンパク質骨格の正確なモデリングを可能にします。
最初に、決定論的な連続時間ダイナミクスを学習し、$\text{SE}(3)$ 上の不変ターゲット分布を照合するためのシミュレーション不要のアプローチである FoldFlow-Base を紹介します。
次に、リーマン最適輸送を組み込んで FoldFlow-OT を作成することでトレーニングを加速し、よりシンプルで安定したフローの構築につながります。
最後に、$\text{SE} 上の確率的連続時間ダイナミクスを学習するためにリーマン OT とシミュレーションフリー トレーニングの両方を組み合わせた FoldFlow-SFM を設計します(3)。
当社の FoldFlow 生成モデル ファミリは、タンパク質の生成モデリングに対する以前のアプローチに比べて、いくつかの重要な利点を提供します。拡散ベースのアプローチよりも安定しており、トレーニングが高速です。また、当社のモデルは、任意の不変ソース分布を任意の不変量に​​マッピングする機能を備えています。
$\text{SE}(3)$ にわたるターゲット分布。
私たちは、最大 300 ドルのアミノ酸のタンパク質バックボーン生成で、高品質で設計可能で多様で新規なサンプルにつながる FoldFlow を経験的に検証しています。

要約(オリジナル)

The computational design of novel protein structures has the potential to impact numerous scientific disciplines greatly. Toward this goal, we introduce FoldFlow, a series of novel generative models of increasing modeling power based on the flow-matching paradigm over $3\mathrm{D}$ rigid motions — i.e. the group $\text{SE}(3)$ — enabling accurate modeling of protein backbones. We first introduce FoldFlow-Base, a simulation-free approach to learning deterministic continuous-time dynamics and matching invariant target distributions on $\text{SE}(3)$. We next accelerate training by incorporating Riemannian optimal transport to create FoldFlow-OT, leading to the construction of both more simple and stable flows. Finally, we design FoldFlow-SFM, coupling both Riemannian OT and simulation-free training to learn stochastic continuous-time dynamics over $\text{SE}(3). Our family of FoldFlow, generative models offers several key advantages over previous approaches to the generative modeling of proteins: they are more stable and faster to train than diffusion-based approaches, and our models enjoy the ability to map any invariant source distribution to any invariant target distribution over $\text{SE}(3)$. Empirically, we validate FoldFlow, on protein backbone generation of up to $300$ amino acids leading to high-quality designable, diverse, and novel samples.

arxiv情報

著者 Avishek Joey Bose,Tara Akhound-Sadegh,Guillaume Huguet,Kilian Fatras,Jarrid Rector-Brooks,Cheng-Hao Liu,Andrei Cristian Nica,Maksym Korablyov,Michael Bronstein,Alexander Tong
発行日 2024-03-31 16:38:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク