Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey from Precision to Interpretability


創薬分野への人工知能 (AI) の統合は、学際的な科学研究の成長分野となっています。
しかし、従来の AI モデルは、複雑な生物医学的構造 (2D または 3D のタンパク質および分子構造など) の処理と、出力の解釈の提供において大幅に制限されており、実際の適用を妨げています。
最近、グラフ機械学習 (GML) は、グラフ構造の生物医学データをモデル化し、それらの特性と機能的関係を調査するその並外れた能力により、かなりの注目を集めています。
多大な努力にもかかわらず、GML メソッドは、監視のスパース性を処理し、学習および推論プロセスで解釈可能性を提供する能力が限られていることや、関連するドメインの知識を利用する際の効果がないことなど、いくつかの欠陥に悩まされています。
それに応じて、最近の研究では、外部の生物医学知識を GML パイプラインに統合して、限られたトレーニング インスタンスでより正確で解釈可能な創薬を実現することが提案されています。
この調査では、長年にわたる創薬原理の包括的な概要を提示し、グラフ構造のデータと知識データベースの基本的な概念と最先端の手法を提供し、創薬のための知識拡張グラフ機械学習 (KaGML) を正式に要約します。
慎重に設計された検索方法に従って収集された関連する KaGML 作品の徹底的なレビューを提案し、新しく定義された分類に従ってそれらを 4 つのカテゴリに整理します。


The integration of Artificial Intelligence (AI) into the field of drug discovery has been a growing area of interdisciplinary scientific research. However, conventional AI models are heavily limited in handling complex biomedical structures (such as 2D or 3D protein and molecule structures) and providing interpretations for outputs, which hinders their practical application. As of late, Graph Machine Learning (GML) has gained considerable attention for its exceptional ability to model graph-structured biomedical data and investigate their properties and functional relationships. Despite extensive efforts, GML methods still suffer from several deficiencies, such as the limited ability to handle supervision sparsity and provide interpretability in learning and inference processes, and their ineffectiveness in utilising relevant domain knowledge. In response, recent studies have proposed integrating external biomedical knowledge into the GML pipeline to realise more precise and interpretable drug discovery with limited training instances. However, a systematic definition for this burgeoning research direction is yet to be established. This survey presents a comprehensive overview of long-standing drug discovery principles, provides the foundational concepts and cutting-edge techniques for graph-structured data and knowledge databases, and formally summarises Knowledge-augmented Graph Machine Learning (KaGML) for drug discovery. we propose a thorough review of related KaGML works, collected following a carefully designed search methodology, and organise them into four categories following a novel-defined taxonomy. To facilitate research in this promptly emerging field, we also share collected practical resources that are valuable for intelligent drug discovery and provide an in-depth discussion of the potential avenues for future advancements.


著者 Zhiqiang Zhong,Anastasia Barkova,Davide Mottin
発行日 2023-03-07 16:48:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク