要約
ナレッジ グラフは、現実世界のエンティティとその関係を、オントロジーによってサポートされる意味的に豊富な構造で表します。
機械学習手法を使用してこのデータを探索する場合、多くの場合、ナレッジ グラフの埋め込みに依存します。これにより、構造的およびローカルなグラフ近傍プロパティを保持するエンティティの潜在表現が生成されますが、説明可能性は犠牲になります。
ただし、リンクや関係の予測などのタスクでは、どの特定の特徴が関係をより適切に説明するかを理解することが、複雑または重要なアプリケーションをサポートするために重要です。
ナレッジグラフにおける関係予測をサポートする説明可能な表現のための新しいアプローチである SEEK を提案します。
これは、エンティティ間の関連する共有意味論的側面 (つまり、サブグラフ) の特定と各サブグラフの表現の学習に基づいており、多面的で説明可能な表現を生成します。
私たちは、タンパク質間相互作用予測と遺伝子疾患関連予測という 2 つの現実世界の非常に複雑な関係予測タスクに関して SEEK を評価します。
確立されたベンチマークを使用した広範な分析により、SEEK は共有された意味論的側面に基づいて十分かつ必要な説明の両方を特定しながら、標準的な学習表現方法よりも大幅に優れたパフォーマンスを達成することが実証されました。
要約(オリジナル)
Knowledge graphs represent real-world entities and their relations in a semantically-rich structure supported by ontologies. Exploring this data with machine learning methods often relies on knowledge graph embeddings, which produce latent representations of entities that preserve structural and local graph neighbourhood properties, but sacrifice explainability. However, in tasks such as link or relation prediction, understanding which specific features better explain a relation is crucial to support complex or critical applications. We propose SEEK, a novel approach for explainable representations to support relation prediction in knowledge graphs. It is based on identifying relevant shared semantic aspects (i.e., subgraphs) between entities and learning representations for each subgraph, producing a multi-faceted and explainable representation. We evaluate SEEK on two real-world highly complex relation prediction tasks: protein-protein interaction prediction and gene-disease association prediction. Our extensive analysis using established benchmarks demonstrates that SEEK achieves significantly better performance than standard learning representation methods while identifying both sufficient and necessary explanations based on shared semantic aspects.
arxiv情報
著者 | Rita T. Sousa,Sara Silva,Catia Pesquita |
発行日 | 2023-06-22 06:18:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google