MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures

要約

薬物分子の特性を正確に予測する探求は、人工知能創薬 (AIDD) の分野において根本的な課題を引き起こしています。
薬物分子の効果的な表現は、この追求において極めて重要な要素として浮上します。
現代の最先端の研究では、主に自己教師あり学習 (SSL) 技術を利用して、大規模な標識されていない分子データから意味のある構造表現を抽出し、その後、これらの表現を一連の下流タスクに合わせて微調整しています。
しかし、これらの研究の本質的な欠点は、分子画像や SMILES 表現などの分子情報の 1 つのモダリティにのみ依存しているため、さまざまな分子モダリティの潜在的な相補性が無視されていることです。
この制限に対応して、画像とグラフ構造に基づいて分子特性を予測するための新しい MultiModaL 分子事前トレーニング フレームワークである MolIG を提案します。
MolIG モデルは、分子グラフと分子画像の間の一貫性と相関関係を革新的に活用して、自己教師ありタスクを実行し、両方の分子表現形式の長所を効果的に融合します。
この総合的なアプローチにより、極めて重要な分子構造特性と高レベルの意味論的情報を捕捉することが可能になります。
事前トレーニングが完了すると、グラフ ニューラル ネットワーク (GNN) エンコーダーが下流タスクの予測に使用されます。
高度なベースライン モデルと比較して、MolIG は、MoleculeNet Benchmark Group や ADMET Benchmark Group などのベンチマーク グループ内の分子特性予測に関連する下流タスクで優れたパフォーマンスを示します。

要約(オリジナル)

The quest for accurate prediction of drug molecule properties poses a fundamental challenge in the realm of Artificial Intelligence Drug Discovery (AIDD). An effective representation of drug molecules emerges as a pivotal component in this pursuit. Contemporary leading-edge research predominantly resorts to self-supervised learning (SSL) techniques to extract meaningful structural representations from large-scale, unlabeled molecular data, subsequently fine-tuning these representations for an array of downstream tasks. However, an inherent shortcoming of these studies lies in their singular reliance on one modality of molecular information, such as molecule image or SMILES representations, thus neglecting the potential complementarity of various molecular modalities. In response to this limitation, we propose MolIG, a novel MultiModaL molecular pre-training framework for predicting molecular properties based on Image and Graph structures. MolIG model innovatively leverages the coherence and correlation between molecule graph and molecule image to execute self-supervised tasks, effectively amalgamating the strengths of both molecular representation forms. This holistic approach allows for the capture of pivotal molecular structural characteristics and high-level semantic information. Upon completion of pre-training, Graph Neural Network (GNN) Encoder is used for the prediction of downstream tasks. In comparison to advanced baseline models, MolIG exhibits enhanced performance in downstream tasks pertaining to molecular property prediction within benchmark groups such as MoleculeNet Benchmark Group and ADMET Benchmark Group.

arxiv情報

著者 Zhuoyuan Wang,Jiacong Mi,Shan Lu,Jieyue He
発行日 2024-04-19 13:19:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, physics.chem-ph, q-bio.BM パーマリンク