SemlaFlow — Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching

要約

構造ベースの薬物設計への潜在的な影響により、最近の3D立体構造とともに分子グラフを共同で生成する方法が最近目立っています。
ただし、現在のアプローチは、サンプリング時間が非常に遅いか、化学的妥当性が低い分子を生成することがよくあります。
これらの制限に対処すると、Semlaは、スケーラブルなE(3)equivariantメッセージの通過アーキテクチャを提案します。
さらに、無条件の3D分子生成モデルであるSemlaflowを導入します。これは、等垂直フローマッチングを使用してトレーニングされ、原子タイプ、座標、結合タイプ、および正式な料金を介したジョイント分布を生成します。
私たちのモデルは、最先端のスピードアップに対応する20個のサンプリングステップで、ベンチマークデータセットで最先端の結果を生成します。
さらに、3D生成の現在の評価方法の制限を強調し、無条件分子発電機の新しいベンチマークメトリックを提案します。
最後に、これらの新しいメトリックを使用して、現在のアプローチに対して高品質のサンプルを生成するモデルの能力を比較し、Semlaflowの強力なパフォーマンスをさらに実証します。

要約(オリジナル)

Methods for jointly generating molecular graphs along with their 3D conformations have gained prominence recently due to their potential impact on structure-based drug design. Current approaches, however, often suffer from very slow sampling times or generate molecules with poor chemical validity. Addressing these limitations, we propose Semla, a scalable E(3)-equivariant message passing architecture. We further introduce an unconditional 3D molecular generation model, SemlaFlow, which is trained using equivariant flow matching to generate a joint distribution over atom types, coordinates, bond types and formal charges. Our model produces state-of-the-art results on benchmark datasets with as few as 20 sampling steps, corresponding to a two order-of-magnitude speedup compared to state-of-the-art. Furthermore, we highlight limitations of current evaluation methods for 3D generation and propose new benchmark metrics for unconditional molecular generators. Finally, using these new metrics, we compare our model’s ability to generate high quality samples against current approaches and further demonstrate SemlaFlow’s strong performance.

arxiv情報

著者 Ross Irwin,Alessandro Tibo,Jon Paul Janet,Simon Olsson
発行日 2025-02-28 16:56:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE パーマリンク