要約
タンパク質ポケットに結合する薬物のような分子を広大な化学空間から探索することは、創薬において困難な課題です。
最近、構造ベースの生成モデルが導入され、任意のタンパク質構造の分子を生成する方法を学習することで、より効率的になることが期待されています。
ただし、限られたタンパク質-リガンド複合体データセットの分布を学習するため、構造ベースの方法は、1 つのポケットのみに対して結合分子を生成する最適化ベースの方法をまだ上回ることができません。
タンパク質ターゲット全体での学習を活用しながらデータの制限を克服するために、トレーニング データの分布ではなく、ポケット構造を条件とした報酬分布をモデル化することを選択します。
私たちは、構造ベースの薬剤設計のための新しい GFlowNet ベースのアプローチである TacoGFN を設計します。これは、親和性と特性報酬に比例する確率で、任意のタンパク質ポケット構造に条件付けされた分子を生成できます。
CrossDocked2020 ベンチマークの生成設定では、TacoGFN は、生成時間を数桁改善しながら、Vina Dock スコア中央値で $56.0\%$ および $-8.44$ kcal/mol という最先端の成功率を達成しました。
TacoGFN を微調整すると、Vina Dock スコアの中央値が $-10.93$ kcal/mol に、成功率が $88.8\%$ にさらに向上し、すべての最適化ベースの手法を上回りました。
要約(オリジナル)
Searching the vast chemical space for drug-like molecules that bind with a protein pocket is a challenging task in drug discovery. Recently, structure-based generative models have been introduced which promise to be more efficient by learning to generate molecules for any given protein structure. However, since they learn the distribution of a limited protein-ligand complex dataset, structure-based methods do not yet outperform optimization-based methods that generate binding molecules for just one pocket. To overcome limitations on data while leveraging learning across protein targets, we choose to model the reward distribution conditioned on pocket structure, instead of the training data distribution. We design TacoGFN, a novel GFlowNet-based approach for structure-based drug design, which can generate molecules conditioned on any protein pocket structure with probabilities proportional to its affinity and property rewards. In the generative setting for CrossDocked2020 benchmark, TacoGFN attains a state-of-the-art success rate of $56.0\%$ and $-8.44$ kcal/mol in median Vina Dock score while improving the generation time by multiple orders of magnitude. Fine-tuning TacoGFN further improves the median Vina Dock score to $-10.93$ kcal/mol and the success rate to $88.8\%$, outperforming all optimization-based methods.
arxiv情報
| 著者 | Tony Shen,Seonghwan Seo,Grayson Lee,Mohit Pandey,Jason R Smith,Artem Cherkasov,Woo Youn Kim,Martin Ester |
| 発行日 | 2024-09-06 17:26:00+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google