要約
小分子の生成設計における合成化可能性は、依然としてボトルネックのままです。
合成化可能性を考慮する既存の作業は、生成された分子の合成ルートを出力することができます。
ただし、合成の容易さに対処し、望ましい反応制約を組み込む柔軟性を可能にする際には、最小限の注意が払われています。
この作業では、操縦可能で粒状合成能力制御を可能にする小分子生成設計フレームワークを提案します。
生成された分子は、事前に定義された許可反応を含む予測された合成ルートを使用して、オプションで他のものを避けながら、任意のマルチパラメーター最適化目標を満たします。
また、すべての反応が事前に定義されたセットに属していることを強制することもできます。
最も一般的な医療化学変換全体で、これらの反応制約を混合して一致させる能力を示します。
次に、私たちのフレームワークを使用して、産業副産物をde novo最適化分子に向けて評価する方法を示します。
さらに進むと、合成可能性の制約に対する粒状制御が、超大型メイクオンデマンドライブラリの仮想スクリーニングをゆるく模倣する方法を示します。
1つのGPUのみを使用して、15K分子を生成およびドッキングして、142Bメイクオンデマンド分子を構成するFreedom 4.0の有望な候補を特定します(ライブラリの0.00001%のみを評価します)。
反応制約を満たす生成された分子には、正確な一致率が90%以上です。
最後に、最近の合成可能性に制約された生成モデルに対してフレームワークをベンチマークし、すべての分子が単一の反応型から合成可能でなければならないという追加の制約を課した場合でも、最高のサンプル効率を実証します。
主なテーマは、事前に訓練されたジェネラリストの分子生成モデルを、強化学習を通じて挑戦的な合成化可能性の制約の下で特性を最適化した小分子を生成するためにインセンティブ化できることを実証することです。
要約(オリジナル)
Synthesizability in small molecule generative design remains a bottleneck. Existing works that do consider synthesizability can output predicted synthesis routes for generated molecules. However, there has been minimal attention in addressing the ease of synthesis and enabling flexibility to incorporate desired reaction constraints. In this work, we propose a small molecule generative design framework that enables steerable and granular synthesizability control. Generated molecules satisfy arbitrary multi-parameter optimization objectives with predicted synthesis routes containing pre-defined allowed reactions, while optionally avoiding others. One can also enforce that all reactions belong to a pre-defined set. We show the capability to mix-and-match these reaction constraints across the most common medicinal chemistry transformations. Next, we show how our framework can be used to valorize industrial byproducts towards de novo optimized molecules. Going further, we demonstrate how granular control over synthesizability constraints can loosely mimic virtual screening of ultra-large make-on-demand libraries. Using only a single GPU, we generate and dock 15k molecules to identify promising candidates in Freedom 4.0 constituting 142B make-on-demand molecules (assessing only 0.00001% of the library). Generated molecules satisfying the reaction constraints have > 90% exact match rate. Lastly, we benchmark our framework against recent synthesizability-constrained generative models and demonstrate the highest sample efficiency even when imposing the additional constraint that all molecules must be synthesizable from a single reaction type. The main theme is demonstrating that a pre-trained generalist molecular generative model can be incentivized to generate property-optimized small molecules under challenging synthesizability constraints through reinforcement learning.
arxiv情報
著者 | Jeff Guo,Víctor Sabanza-Gil,Zlatko Jončev,Jeremy S. Luterbacher,Philippe Schwaller |
発行日 | 2025-05-13 17:53:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google