要約
ナレッジ グラフ エンベディング (KGE) は、ナレッジ グラフ (KG) に機械学習手法を適用して、類似点と類似性に基づいた非古典的な推論機能を提供します。
学習された KG 埋め込みは通常、すべての潜在的な回答をランク付けすることでクエリに回答するために使用されますが、ランク付けには意味のある確率的解釈が欠けていることが多く、ランクが低い回答が真である確率が必ずしも低いとは限りません。
この制限により、もっともらしい答えとありえない答えを区別することが困難になり、医療のような一か八かの分野での KGE 手法の適用に課題が生じています。
私たちは、確率的保証のある正解を含む解答セットの生成を可能にする等角予測の理論を適用することで、この問題に対処します。
等角予測を使用して、リンク予測タスクのそのような応答セットを生成する方法を説明します。
6 つの代表的な KGE 手法を使用した 4 つのベンチマーク データセットに対する経験的評価により、生成された回答セットが等角予測の理論によって与えられる確率的保証を満たすことが検証されます。
また、生成された応答セットが適切なサイズであることが多く、そのサイズがクエリの難易度によく適応することも示します。
要約(オリジナル)
Knowledge graph embeddings (KGE) apply machine learning methods on knowledge graphs (KGs) to provide non-classical reasoning capabilities based on similarities and analogies. The learned KG embeddings are typically used to answer queries by ranking all potential answers, but rankings often lack a meaningful probabilistic interpretation – lower-ranked answers do not necessarily have a lower probability of being true. This limitation makes it difficult to distinguish plausible from implausible answers, posing challenges for the application of KGE methods in high-stakes domains like medicine. We address this issue by applying the theory of conformal prediction that allows generating answer sets, which contain the correct answer with probabilistic guarantees. We explain how conformal prediction can be used to generate such answer sets for link prediction tasks. Our empirical evaluation on four benchmark datasets using six representative KGE methods validates that the generated answer sets satisfy the probabilistic guarantees given by the theory of conformal prediction. We also demonstrate that the generated answer sets often have a sensible size and that the size adapts well with respect to the difficulty of the query.
arxiv情報
著者 | Yuqicheng Zhu,Nico Potyka,Jiarong Pan,Bo Xiong,Yunjie He,Evgeny Kharlamov,Steffen Staab |
発行日 | 2024-08-15 16:36:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google