Geometric-Facilitated Denoising Diffusion Model for 3D Molecule Generation

要約

ノイズ除去拡散モデルは、複数の研究分野で大きな可能性を示しています。
de novo 3D 分子生成に関する既存の拡散ベースの生成方法は、2 つの大きな課題に直面しています。
分子内の大部分の重原子は単結合を介して複数の原子に接続できるため、分子の形状をモデル化するためにペアごとの距離だけを使用するだけでは不十分です。
したがって、最初の方法では、複雑なマルチボディの原子間の関係を捕捉し、高品質の特徴を学習できるノイズ除去カーネルとして効果的なニューラル ネットワークを提案します。
グラフの離散的な性質により、分子に対する主流の拡散ベースの手法は、事前に定義されたルールに大きく依存し、間接的な方法でエッジを生成します。
2 番目の課題には、分子の生成を拡散に適応させ、結合の存在を正確に予測することが含まれます。
私たちの研究では、拡散プロセスにおける分子の立体構造を更新する反復的な方法が分子動力学と一致していると考え、幾何学的促進分子拡散 (GFMDiff) と呼ばれる新しい分子生成法を導入しました。
最初の課題では、デュアルトラック変圧器ネットワーク (DTN) を導入して、グローバルな空間関係を完全に調査し、フィーチャとジオメトリの正確な予測に貢献する高品質の表現を学習します。
2 番目の課題として、エッジを潜在空間に直接埋め込むのではなく、トレーニング期間中の結合の形成に介入する幾何学的促進損失 (GFLoss) を設計します。
現在のベンチマークに関する包括的な実験により、GFMDiff の優位性が実証されました。

要約(オリジナル)

Denoising diffusion models have shown great potential in multiple research areas. Existing diffusion-based generative methods on de novo 3D molecule generation face two major challenges. Since majority heavy atoms in molecules allow connections to multiple atoms through single bonds, solely using pair-wise distance to model molecule geometries is insufficient. Therefore, the first one involves proposing an effective neural network as the denoising kernel that is capable to capture complex multi-body interatomic relationships and learn high-quality features. Due to the discrete nature of graphs, mainstream diffusion-based methods for molecules heavily rely on predefined rules and generate edges in an indirect manner. The second challenge involves accommodating molecule generation to diffusion and accurately predicting the existence of bonds. In our research, we view the iterative way of updating molecule conformations in diffusion process is consistent with molecular dynamics and introduce a novel molecule generation method named Geometric-Facilitated Molecular Diffusion (GFMDiff). For the first challenge, we introduce a Dual-Track Transformer Network (DTN) to fully excevate global spatial relationships and learn high quality representations which contribute to accurate predictions of features and geometries. As for the second challenge, we design Geometric-Facilitated Loss (GFLoss) which intervenes the formation of bonds during the training period, instead of directly embedding edges into the latent space. Comprehensive experiments on current benchmarks demonstrate the superiority of GFMDiff.

arxiv情報

著者 Can Xu,Haosen Wang,Weigang Wang,Pengfei Zheng,Hongyang Chen
発行日 2024-01-05 07:29:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク