Accelerating Inference in Molecular Diffusion Models with Latent Representations of Protein Structure

要約

拡散生成モデルは、構造生物学および構造に基づく医薬品設計の問題に対処するための強力なフレームワークとして登場しました。
これらのモデルは 3D 分子構造に直接作用します。
グラフ サイズによるグラフ ニューラル ネットワーク (GNN) のスケーリングが好ましくないこと、および拡散モデルに固有の推論速度が比較的遅いため、既存の分子拡散モデルの多くは、トレーニングと推論を実行可能にするためにタンパク質構造の粗粒表現に依存しています。
ただし、このような粗い表現では、分子相互作用のモデリングに不可欠な情報が無視され、生成される構造の品質が損なわれます。
この研究では、分子構造の潜在表現を学習するための新しい GNN ベースのアーキテクチャを紹介します。
de novo リガンド設計用の拡散モデルを使用してエンドツーエンドでトレーニングすると、私たちのモデルは、推論時間を 3 分の 1 に短縮しながら、全原子タンパク質表現のモデルと同等のパフォーマンスを達成します。

要約(オリジナル)

Diffusion generative models have emerged as a powerful framework for addressing problems in structural biology and structure-based drug design. These models operate directly on 3D molecular structures. Due to the unfavorable scaling of graph neural networks (GNNs) with graph size as well as the relatively slow inference speeds inherent to diffusion models, many existing molecular diffusion models rely on coarse-grained representations of protein structure to make training and inference feasible. However, such coarse-grained representations discard essential information for modeling molecular interactions and impair the quality of generated structures. In this work, we present a novel GNN-based architecture for learning latent representations of molecular structure. When trained end-to-end with a diffusion model for de novo ligand design, our model achieves comparable performance to one with an all-atom protein representation while exhibiting a 3-fold reduction in inference time.

arxiv情報

著者 Ian Dunn,David Ryan Koes
発行日 2023-11-22 15:32:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク