Biomedical Knowledge Graph Embeddings with Negative Statements

要約

ナレッジ グラフは、現実世界のエンティティとその関係を強力に表現したものです。
これらの関係の大部分は肯定的な記述として定義されていますが、特にオープンワールドの仮定の下では、否定的な記述の重要性がますます認識されています。
否定的なステートメントを明示的に考慮すると、エンティティの要約や質問応答などのタスク、またはタンパク質の機能予測などのドメイン固有のタスクのパフォーマンスが向上することが示されています。
しかし、否定的なステートメントがナレッジ グラフ内のエンティティのより正確な表現を生成する可能性があるにもかかわらず、ナレッジ グラフ埋め込みアプローチによる否定的なステートメントの探索には注目されていません。
私たちは、ナレッジ グラフ表現の学習プロセスに否定的なステートメントを組み込む新しいアプローチ、TrueWalks を提案します。
特に、肯定的なステートメントと否定的なステートメントを区別するだけでなく、オントロジーが豊富な知識グラフにおける否定の意味論的な意味も考慮できる新しいウォーク生成方法を提案します。
これは、オントロジーレベルでの否定的なステートメントに関する埋め込みアプローチの不適切性が重大な制限として認識されている生物医学分野のアプリケーションにとって特に重要です。
私たちは、KG 埋め込みに基づく 2 つの異なる予測タスク (タンパク質間相互作用予測と遺伝子疾患関連予測) で、オントロジーが豊富な生物医学知識グラフの TrueWalks を評価します。
私たちは確立されたベンチマークに対して広範な分析を実施し、私たちの手法がすべてのタスクでナレッジ グラフ埋め込みのパフォーマンスを向上できることを実証しました。

要約(オリジナル)

A knowledge graph is a powerful representation of real-world entities and their relations. The vast majority of these relations are defined as positive statements, but the importance of negative statements is increasingly recognized, especially under an Open World Assumption. Explicitly considering negative statements has been shown to improve performance on tasks such as entity summarization and question answering or domain-specific tasks such as protein function prediction. However, no attention has been given to the exploration of negative statements by knowledge graph embedding approaches despite the potential of negative statements to produce more accurate representations of entities in a knowledge graph. We propose a novel approach, TrueWalks, to incorporate negative statements into the knowledge graph representation learning process. In particular, we present a novel walk-generation method that is able to not only differentiate between positive and negative statements but also take into account the semantic implications of negation in ontology-rich knowledge graphs. This is of particular importance for applications in the biomedical domain, where the inadequacy of embedding approaches regarding negative statements at the ontology level has been identified as a crucial limitation. We evaluate TrueWalks in ontology-rich biomedical knowledge graphs in two different predictive tasks based on KG embeddings: protein-protein interaction prediction and gene-disease association prediction. We conduct an extensive analysis over established benchmarks and demonstrate that our method is able to improve the performance of knowledge graph embeddings on all tasks.

arxiv情報

著者 Rita T. Sousa,Sara Silva,Heiko Paulheim,Catia Pesquita
発行日 2023-08-07 10:08:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク