Any-Property-Conditional Molecule Generation with Self-Criticism using Spanning Trees

要約

新しい分子を生成することは困難であり、ほとんどの表現では、多くの無効な分子を生成する生成モデルが生成されます。
スパニング ツリー ベースのグラフ生成 (STGG) は、有効な分子を確実に生成するための有望なアプローチであり、無条件生成に関しては最先端の SMILES およびグラフ拡散モデルを上回るパフォーマンスを発揮します。
現実の世界では、無条件ではなく、1 つまたは複数の望ましい特性を条件として分子を生成できるようにしたいと考えています。
したがって、この作業では、STGG を複数プロパティの条件付き生成に拡張します。
私たちのアプローチである STGG+ には、最新の Transformer アーキテクチャ、トレーニング中のプロパティのランダム マスキング (プロパティのサブセットと分類子を使用しないガイダンスでの条件付けが可能)、補助的なプロパティ予測損失 (モデルが分子を自己批判し、選択できるようにする) が組み込まれています。
最高のもの)、その他の改善。
STGG+ が分布内および分布外の条件付き生成と報酬の最大化において最先端のパフォーマンスを達成することを示します。

要約(オリジナル)

Generating novel molecules is challenging, with most representations leading to generative models producing many invalid molecules. Spanning Tree-based Graph Generation (STGG) is a promising approach to ensure the generation of valid molecules, outperforming state-of-the-art SMILES and graph diffusion models for unconditional generation. In the real world, we want to be able to generate molecules conditional on one or multiple desired properties rather than unconditionally. Thus, in this work, we extend STGG to multi-property-conditional generation. Our approach, STGG+, incorporates a modern Transformer architecture, random masking of properties during training (enabling conditioning on any subset of properties and classifier-free guidance), an auxiliary property-prediction loss (allowing the model to self-criticize molecules and select the best ones), and other improvements. We show that STGG+ achieves state-of-the-art performance on in-distribution and out-of-distribution conditional generation, and reward maximization.

arxiv情報

著者 Alexia Jolicoeur-Martineau,Aristide Baratin,Kisoo Kwon,Boris Knyazev,Yan Zhang
発行日 2024-07-15 14:10:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク