A framework for conditional diffusion modelling with applications in motif scaffolding for protein design

要約

バインダーや酵素の設計など、多くのタンパク質設計アプリケーションでは、高精度で構造モチーフを足場にする必要があります。
ノイズ除去拡散プロセスに基づく生成モデリング パラダイムは、このモチーフ足場問題に対処する有力な候補として浮上し、場合によっては初期の実験で成功を収めています。
拡散パラダイムでは、モチーフの足場は条件付き生成タスクとして扱われ、いくつかの条件付き生成プロトコルが提案されたり、コンピューター ビジョンの文献からインポートされたりしました。
ただし、これらのプロトコルのほとんどはヒューリスティックに基づいて動機づけられています。
ランジュバン力学へのアナロジーを介して行われており、統一的なフレームワークが欠如しており、異なるアプローチ間のつながりが曖昧になっています。
この研究では、条件付きトレーニングと条件付きサンプリング手順を、数学的によく理解されている Doob の h 変換に基づく 1 つの共通のフレームワークの下で統合します。
この新しい視点により、既存のメソッド間のつながりを引き出し、既存の条件付きトレーニング プロトコルの新しいバリエーションを提案できるようになります。
我々は、画像のアウトペイントとモチーフの足場の両方におけるこの新しいプロトコルの有効性を説明し、標準的な方法よりも優れていることを発見しました。

要約(オリジナル)

Many protein design applications, such as binder or enzyme design, require scaffolding a structural motif with high precision. Generative modelling paradigms based on denoising diffusion processes emerged as a leading candidate to address this motif scaffolding problem and have shown early experimental success in some cases. In the diffusion paradigm, motif scaffolding is treated as a conditional generation task, and several conditional generation protocols were proposed or imported from the Computer Vision literature. However, most of these protocols are motivated heuristically, e.g. via analogies to Langevin dynamics, and lack a unifying framework, obscuring connections between the different approaches. In this work, we unify conditional training and conditional sampling procedures under one common framework based on the mathematically well-understood Doob’s h-transform. This new perspective allows us to draw connections between existing methods and propose a new variation on existing conditional training protocols. We illustrate the effectiveness of this new protocol in both, image outpainting and motif scaffolding and find that it outperforms standard methods.

arxiv情報

著者 Kieran Didi,Francisco Vargas,Simon V Mathis,Vincent Dutordoir,Emile Mathieu,Urszula J Komorowska,Pietro Lio
発行日 2024-02-19 16:40:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク