SynthFormer: Equivariant Pharmacophore-based Generation of Synthesizable Molecules for Ligand-Based Drug Design

要約

創薬は、患者に新しい薬をもたらすためにかなりの時間とコストを必要とする複雑でリソース集約型のプロセスです。
多くの生成モデルは、創薬を加速することを目指していますが、合成的にアクセス可能な分子を生成するものはほとんどありません。
逆に、合成に焦点を当てたモデルは、効果的な薬物設計に重要な3D情報を活用しません。
3D情報とファーマコフォアを入力として導入することにより、合成ツリーとして構成された完全に合成可能な分子を生成する新しい機械学習モデルであるSynthformerを紹介します。
Synthformerは、薬物型をエンコードする3D等変量グラフニューラルネットワークを備えており、その後、合成ツリーをトークンのシーケンスとして構築するための変圧器ベースの合成認識デコードメカニズムを備えています。
これは、薬物型に基づいて活性分子を設計し、ヒット分子の周りの局所合成化可能な化学空間を探索し、その特性を最適化する能力を提供できる最初のアプローチです。
さまざまなタンパク質のアクティブ化合物の設計、ヒット膨張、分子特性の最適化など、さまざまな挑戦的なタスクを通じてその効果を実証します。

要約(オリジナル)

Drug discovery is a complex, resource-intensive process requiring significant time and cost to bring new medicines to patients. Many generative models aim to accelerate drug discovery, but few produce synthetically accessible molecules. Conversely, synthesis-focused models do not leverage the 3D information crucial for effective drug design. We introduce SynthFormer, a novel machine learning model that generates fully synthesizable molecules, structured as synthetic trees, by introducing both 3D information and pharmacophores as input. SynthFormer features a 3D equivariant graph neural network to encode pharmacophores, followed by a Transformer-based synthesis-aware decoding mechanism for constructing synthetic trees as a sequence of tokens. It is a first-of-its-kind approach that could provide capabilities for designing active molecules based on pharmacophores, exploring the local synthesizable chemical space around hit molecules and optimizing their properties. We demonstrate its effectiveness through various challenging tasks, including designing active compounds for a range of proteins, performing hit expansion and optimizing molecular properties.

arxiv情報

著者 Zygimantas Jocys,Zhanxing Zhu,Henriette M. G. Willems,Katayoun Farrahi
発行日 2025-01-29 15:15:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク