Predicting Drug-Drug Interactions Using Knowledge Graphs


未知の DDI を予測するために、最近、研究ではナレッジ グラフ (KG) を組み込み始めました。ナレッジ グラフ (KG) は、単一の薬物特性を使用するよりも優れた薬物表現を提供するエンティティ間の関係を把握できるためです。
この論文では、公的医薬品リポジトリのいくつかの医薬品特徴を KG に統合し、さまざまな翻訳、因数分解、およびニューラル ネットワーク (NN) ベースの KG 埋め込み (KGE) を使用してグラフにノードを埋め込む、medicX エンドツーエンド フレームワークを提案します。
最終的には、未知の DDI を予測する機械学習 (ML) アルゴリズムを使用します。
さまざまな翻訳および因数分解ベースの KGE モデルの中で、最もパフォーマンスの高い組み合わせは、Long Short-Term Memory (LSTM) ネットワークを備えた ComplEx 埋め込み手法であることがわかりました。これは、
DDI は DrugBank バージョン 5.1.8 にあります。
このスコアは、最先端モデルの DeepDDI より 5.61% 優れています。
さらに、グラフ ニューラル ネットワーク (GNN) を使用するグラフ オート エンコーダー モデルも開発し、91.94% の F1 スコアを達成しました。
その結果、GNN は ComplEx モデルよりも KG の基礎となるセマンティクスをマイニングする強力な能力を実証しているため、GNN 内で高次元の埋め込みを使用することで最先端のパフォーマンスを実現できます。


In the last decades, people have been consuming and combining more drugs than before, increasing the number of Drug-Drug Interactions (DDIs). To predict unknown DDIs, recently, studies started incorporating Knowledge Graphs (KGs) since they are able to capture the relationships among entities providing better drug representations than using a single drug property. In this paper, we propose the medicX end-to-end framework that integrates several drug features from public drug repositories into a KG and embeds the nodes in the graph using various translation, factorisation and Neural Network (NN) based KG Embedding (KGE) methods. Ultimately, we use a Machine Learning (ML) algorithm that predicts unknown DDIs. Among the different translation and factorisation-based KGE models, we found that the best performing combination was the ComplEx embedding method with a Long Short-Term Memory (LSTM) network, which obtained an F1-score of 95.19% on a dataset based on the DDIs found in DrugBank version 5.1.8. This score is 5.61% better than the state-of-the-art model DeepDDI. Additionally, we also developed a graph auto-encoder model that uses a Graph Neural Network (GNN), which achieved an F1-score of 91.94%. Consequently, GNNs have demonstrated a stronger ability to mine the underlying semantics of the KG than the ComplEx model, and thus using higher dimension embeddings within the GNN can lead to state-of-the-art performance.


著者 Lizzy Farrugia,Lilian M. Azzopardi,Jeremy Debattista,Charlie Abela
発行日 2023-08-08 10:07:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI パーマリンク