Enhancing Model Learning and Interpretation Using Multiple Molecular Graph Representations for Compound Property and Activity Prediction

要約

タイトル: 化合物の性質と活性予測において複数の分子グラフ表現を利用したモデル学習と解釈の向上

要約:

– グラフニューラルネットワーク(GNN)は、複雑な分子グラフ構造を効率的に学習する能力により、化合物の性質と活性予測において優れたパフォーマンスを示す。
– しかし、化合物表現とモデルの解釈性には、二つの主要な制限が存在する。原子レベルの分子グラフ表現は、自然なトポロジーを捉える能力により一般的に使用されているが、重要なサブストラクチャーや機能群を完全に表現できない場合があるため、制限がある。
– したがって、最近の研究では、還元技術を用いて高次元の情報を統合する代替表現が提案され、両方の表現をモデル学習に利用することができるようになった。ただし、異なる分子グラフ表現によるモデル学習と解釈に関する研究はまだ不足している。
– 解釈性も薬剤探索にとって重要であり、予測の理由を説明するためにモデル解釈を含めた多数の研究が試みられているが、大部分が個別の予測に焦点を当て、異なる分子グラフ表現での解釈の分析がほとんど行われていない。
– この研究は、高次元の情報を統合した複数の分子グラフ表現を紹介し、多様な視点からそのモデル学習と解釈の影響を調査した。結果から、原子グラフ表現と還元分子グラフ表現を組み合わせることで有望なモデルパフォーマンスが得られることが示された。さらに、解釈結果は、背景知識に一貫して沿った重要な特徴や潜在的なサブストラクチャーを提供することができる。これらの多数の分子グラフ表現と解釈分析は、モデルの理解を強化し、薬剤探索に関連するアプリケーションを促進することができる。

要約(オリジナル)

Graph neural networks (GNNs) demonstrate great performance in compound property and activity prediction due to their capability to efficiently learn complex molecular graph structures. However, two main limitations persist including compound representation and model interpretability. While atom-level molecular graph representations are commonly used because of their ability to capture natural topology, they may not fully express important substructures or functional groups which significantly influence molecular properties. Consequently, recent research proposes alternative representations employing reduction techniques to integrate higher-level information and leverages both representations for model learning. However, there is still a lack of study about different molecular graph representations on model learning and interpretation. Interpretability is also crucial for drug discovery as it can offer chemical insights and inspiration for optimization. Numerous studies attempt to include model interpretation to explain the rationale behind predictions, but most of them focus solely on individual prediction with little analysis of the interpretation on different molecular graph representations. This research introduces multiple molecular graph representations that incorporate higher-level information and investigates their effects on model learning and interpretation from diverse perspectives. The results indicate that combining atom graph representation with reduced molecular graph representation can yield promising model performance. Furthermore, the interpretation results can provide significant features and potential substructures consistently aligning with background knowledge. These multiple molecular graph representations and interpretation analysis can bolster model comprehension and facilitate relevant applications in drug discovery.

arxiv情報

著者 Apakorn Kengkanna,Masahito Ohue
発行日 2023-04-13 04:20:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, q-bio.BM, q-bio.MN パーマリンク