Exploiting Large Language Models Capabilities for Question Answer-Driven Knowledge Graph Completion Across Static and Temporal Domains

要約

ナレッジ グラフ補完 (KGC) は、ナレッジ グラフ (KG) 内で欠落しているトリプルを特定することを目的としています。
これは通常、リンク予測やインスタンスの完了などのタスクを通じて実現されます。
ただし、これらの方法は多くの場合、静的ナレッジ グラフ (SKG) または時間的ナレッジ グラフ (TKG) のいずれかに焦点を当て、スコープ内のトリプルのみを扱います。
このペーパーでは、Generative Subgraph-based KGC (GS-KGC) と呼ばれる新しい生成補完フレームワークを紹介します。
GS-KGC は、質問応答形式を採用してターゲット エンティティを直接生成し、複数の可能な答えがある質問の課題に対処します。
KG 内のエンティティと関係を中心としたサブグラフを抽出し、そこから負のサンプルと近傍情報を個別に取得して 1 対多の問題に対処する戦略を提案します。
私たちの方法では、既知の事実を使用してネガティブ サンプルを生成し、新しい情報の発見を容易にします。
さらに、既知のエンティティの近傍パス データを収集して洗練し、大規模言語モデル (LLM) での推論を強化するためのコンテキスト情報を提供します。
私たちの実験では、提案された方法を 4 つの SKG と 2 つの TKG で評価し、5 つのデータセットで最先端の Hits@1 メトリクスを達成しました。
結果の分析により、GS-KGC は既存の KG 内の新しいトリプルを発見し、クローズド KG を超えた新しい事実を生成し、クローズドワールドとオープンワールド KGC の間のギャップを効果的に埋めることができることが示されています。

要約(オリジナル)

Knowledge graph completion (KGC) aims to identify missing triples in a knowledge graph (KG). This is typically achieved through tasks such as link prediction and instance completion. However, these methods often focus on either static knowledge graphs (SKGs) or temporal knowledge graphs (TKGs), addressing only within-scope triples. This paper introduces a new generative completion framework called Generative Subgraph-based KGC (GS-KGC). GS-KGC employs a question-answering format to directly generate target entities, addressing the challenge of questions having multiple possible answers. We propose a strategy that extracts subgraphs centered on entities and relationships within the KG, from which negative samples and neighborhood information are separately obtained to address the one-to-many problem. Our method generates negative samples using known facts to facilitate the discovery of new information. Furthermore, we collect and refine neighborhood path data of known entities, providing contextual information to enhance reasoning in large language models (LLMs). Our experiments evaluated the proposed method on four SKGs and two TKGs, achieving state-of-the-art Hits@1 metrics on five datasets. Analysis of the results shows that GS-KGC can discover new triples within existing KGs and generate new facts beyond the closed KG, effectively bridging the gap between closed-world and open-world KGC.

arxiv情報

著者 Rui Yang,Jiahao Zhu,Jianping Man,Li Fang,Yi Zhou
発行日 2024-08-20 13:13:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク