Context-aware Inductive Knowledge Graph Completion with Latent Type Constraints and Subgraph Reasoning

要約

帰納的知識グラフ補完 (KGC) は、目に見えないエンティティで欠落しているトリプルを予測することを目的としています。
最近の研究では、直接の裏付けとなる証拠として、先頭エンティティと末尾エンティティの間の推論パスのモデル化に焦点を当てています。
ただし、これらの方法は推論パスの存在と品質に大きく依存するため、さまざまなシナリオでの一般的な適用性が制限されます。
さらに、KG に固有の潜在的な型制約と隣接するファクトも、欠落しているトリプルを推論する際に重要であることがわかります。
KG 内のすべての有用な情報を効果的に利用するために、新しいコンテキスト認識型帰納的 KGC ソリューションである CATS を導入します。
適切なプロンプトと監視された微調整による十分なガイダンスにより、CATS は大規模言語モデルの強力な意味理解および推論機能を活性化し、2 つのモジュールで構成されるクエリ トリプルの存在を評価します。
まず、タイプ認識推論モジュールは、候補エンティティがクエリ関係で必要とされる潜在エンティティ タイプと一致するかどうかを評価します。
次に、サブグラフ推論モジュールは、関連する推論パスと隣接するファクトを選択し、クエリ トリプルとの相関を評価します。
広く使用されている 3 つのデータセットでの実験結果は、CATS が 18 の変換、誘導、および少数ショット設定のうち 16 設定で最先端の手法を大幅に上回り、平均絶対 MRR 改善率が 7.2% であることを示しています。

要約(オリジナル)

Inductive knowledge graph completion (KGC) aims to predict missing triples with unseen entities. Recent works focus on modeling reasoning paths between the head and tail entity as direct supporting evidence. However, these methods depend heavily on the existence and quality of reasoning paths, which limits their general applicability in different scenarios. In addition, we observe that latent type constraints and neighboring facts inherent in KGs are also vital in inferring missing triples. To effectively utilize all useful information in KGs, we introduce CATS, a novel context-aware inductive KGC solution. With sufficient guidance from proper prompts and supervised fine-tuning, CATS activates the strong semantic understanding and reasoning capabilities of large language models to assess the existence of query triples, which consist of two modules. First, the type-aware reasoning module evaluates whether the candidate entity matches the latent entity type as required by the query relation. Then, the subgraph reasoning module selects relevant reasoning paths and neighboring facts, and evaluates their correlation to the query triple. Experiment results on three widely used datasets demonstrate that CATS significantly outperforms state-of-the-art methods in 16 out of 18 transductive, inductive, and few-shot settings with an average absolute MRR improvement of 7.2%.

arxiv情報

著者 Muzhi Li,Cehao Yang,Chengjin Xu,Zixing Song,Xuhui Jiang,Jian Guo,Ho-fung Leung,Irwin King
発行日 2024-12-27 15:32:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク