FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction

要約

タンパク質リガンド構造の強力な生成AIモデルが最近提案されていますが、これらの方法のほとんどは、柔軟なタンパク質リガンドドッキングとアフィニティ推定の両方をサポートするものはほとんどありません。
そうする人のうち、複数の結合リガンドを同時に直接モデル化することも、薬物学的に関連する薬物標的について厳密にベンチマークされている人も、創薬の取り組みにおける広範な採用を妨げている人はいません。
この作業では、任意の数の結合リガンドのためにバインド(apo)のカウンターパートに直接マッピングされることを学習する条件付きフローマッチングに基づく最初の深い幾何学的生成モデルであるフロードックを提案します。
さらに、FlowDockは、生成されたタンパク質リガンド複合体構造のそれぞれと予測された構造信頼スコアと結合親和性値を提供し、新しい(マルチリガンド)薬物ターゲットの高速仮想スクリーニングを可能にします。
For the well-known PoseBusters Benchmark dataset, FlowDock outperforms single-sequence AlphaFold 3 with a 51% blind docking success rate using unbound (apo) protein input structures and without any information derived from multiple sequence alignments, and for the challenging new DockGen-E dataset, FlowDock outperforms single-sequence AlphaFold 3 and matches single-sequence Chai-1 for binding pocket generalization.
さらに、構造予測のための技術の第16回のコミュニティ全体の批判的評価(CASP16)のリガンドカテゴリでは、140のタンパク質リガンド複合体にわたる薬理学的結合親和性推定のトップ5方法にランクされ、仮想スクリーニングにおける学習した表現の有効性が示されました。
ソースコード、データ、および事前に訓練されたモデルは、https://github.com/bioinfomachinelearning/flowdockで入手できます。

要約(オリジナル)

Powerful generative AI models of protein-ligand structure have recently been proposed, but few of these methods support both flexible protein-ligand docking and affinity estimation. Of those that do, none can directly model multiple binding ligands concurrently or have been rigorously benchmarked on pharmacologically relevant drug targets, hindering their widespread adoption in drug discovery efforts. In this work, we propose FlowDock, the first deep geometric generative model based on conditional flow matching that learns to directly map unbound (apo) structures to their bound (holo) counterparts for an arbitrary number of binding ligands. Furthermore, FlowDock provides predicted structural confidence scores and binding affinity values with each of its generated protein-ligand complex structures, enabling fast virtual screening of new (multi-ligand) drug targets. For the well-known PoseBusters Benchmark dataset, FlowDock outperforms single-sequence AlphaFold 3 with a 51% blind docking success rate using unbound (apo) protein input structures and without any information derived from multiple sequence alignments, and for the challenging new DockGen-E dataset, FlowDock outperforms single-sequence AlphaFold 3 and matches single-sequence Chai-1 for binding pocket generalization. Additionally, in the ligand category of the 16th community-wide Critical Assessment of Techniques for Structure Prediction (CASP16), FlowDock ranked among the top-5 methods for pharmacological binding affinity estimation across 140 protein-ligand complexes, demonstrating the efficacy of its learned representations in virtual screening. Source code, data, and pre-trained models are available at https://github.com/BioinfoMachineLearning/FlowDock.

arxiv情報

著者 Alex Morehead,Jianlin Cheng
発行日 2025-03-24 16:50:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.2.1, q-bio.BM, q-bio.QM パーマリンク