Molecule Joint Auto-Encoding: Trajectory Pretraining with 2D and 3D Diffusion

要約

最近、創薬のための人工知能に対する機械学習と化学の両方の分野への関心が高まっています。
創薬の基本的な構成要素は分子の幾何学であるため、分子の幾何学的表現が創薬のための機械学習技術をより効果的に利用するための主なボトルネックとなります。
この研究では、分子結合自動エンコーディング (MoleculeJAE) の事前学習方法を提案します。
MoleculeJAE は 2D 結合 (トポロジー) と 3D 立体配座 (ジオメトリ) 情報の両方を学習でき、拡散プロセス モデルはそのような 2 つのモダリティの拡張された軌道を模倣するために適用されます。これに基づいて、MoleculeJAE は自己構造に固有の化学構造を学習します。
監視された方法。
したがって、MoleculeJAE の事前トレーニングされた幾何学的表現は、下流の幾何学関連タスクに利益をもたらすことが期待されます。
MoleculeJAE は、12 の競合ベースラインと比較することで、20 タスク中 15 タスクで最先端のパフォーマンスに達し、その有効性を経験的に証明しています。

要約(オリジナル)

Recently, artificial intelligence for drug discovery has raised increasing interest in both machine learning and chemistry domains. The fundamental building block for drug discovery is molecule geometry and thus, the molecule’s geometrical representation is the main bottleneck to better utilize machine learning techniques for drug discovery. In this work, we propose a pretraining method for molecule joint auto-encoding (MoleculeJAE). MoleculeJAE can learn both the 2D bond (topology) and 3D conformation (geometry) information, and a diffusion process model is applied to mimic the augmented trajectories of such two modalities, based on which, MoleculeJAE will learn the inherent chemical structure in a self-supervised manner. Thus, the pretrained geometrical representation in MoleculeJAE is expected to benefit downstream geometry-related tasks. Empirically, MoleculeJAE proves its effectiveness by reaching state-of-the-art performance on 15 out of 20 tasks by comparing it with 12 competitive baselines.

arxiv情報

著者 Weitao Du,Jiujiu Chen,Xuecang Zhang,Zhiming Ma,Shengchao Liu
発行日 2023-12-06 12:58:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク