Improving Molecular Graph Generation with Flow Matching and Optimal Transport

要約

分子グラフの生成は医薬品の設計と発見において非常に重要ですが、ノードとエッジ間の複雑な相互依存性により依然として困難です。
拡散モデルは分子グラフ設計における可能性を実証していますが、トレーニングが不安定でサンプリングが非効率であることがよくあります。
生成パフォーマンスとトレーニングの安定性を向上させるために、分子グラフの最適な輸送を組み込んだ離散流マッチング生成モデルである GGFlow を提案します。これには、化学結合間の直接通信を可能にするエッジ拡張グラフ変換器が組み込まれています。
さらに、GGFlow は、モデルの生成軌道を制御するための新しい目標誘導生成フレームワークを導入し、望ましい特性を持つ新しい分子構造を設計することを目的としています。
GGFlow は、無条件および条件付き分子生成タスクの両方で優れたパフォーマンスを示し、既存のベースラインを上回り、その有効性と幅広い用途への可能性を強調しています。

要約(オリジナル)

Generating molecular graphs is crucial in drug design and discovery but remains challenging due to the complex interdependencies between nodes and edges. While diffusion models have demonstrated their potentiality in molecular graph design, they often suffer from unstable training and inefficient sampling. To enhance generation performance and training stability, we propose GGFlow, a discrete flow matching generative model incorporating optimal transport for molecular graphs and it incorporates an edge-augmented graph transformer to enable the direct communications among chemical bounds. Additionally, GGFlow introduces a novel goal-guided generation framework to control the generative trajectory of our model, aiming to design novel molecular structures with the desired properties. GGFlow demonstrates superior performance on both unconditional and conditional molecule generation tasks, outperforming existing baselines and underscoring its effectiveness and potential for wider application.

arxiv情報

著者 Xiaoyang Hou,Tian Zhu,Milong Ren,Dongbo Bu,Xin Gao,Chunming Zhang,Shiwei Sun
発行日 2024-11-08 16:27:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク