Text-To-KG Alignment: Comparing Current Methods on Classification Tasks

要約

大規模なテキスト コーパスとは対照的に、ナレッジ グラフ (KG) は事実情報の緻密で構造化された表現を提供します。
このため、事前トレーニングされた言語モデルにある知識を外部の知識ソースで補完または基礎付けるシステムにとって魅力的です。
これは特に分類タスクに当てはまります。最近の作業では、ConceptNet などの KG から追加のコンテキストとして情報を取得するパイプライン モデルの作成に重点が置かれています。
これらのモデルの多くは複数のコンポーネントで構成されており、これらの部分の数と性質は異なりますが、特定のテキスト クエリに対して、KG から関連するサブグラフを識別して取得しようとするという共通点があります。
KG にはノイズや特異性がよく見られるため、整列されたサブグラフがクエリに完全に関連するシナリオと現在の方法がどのように比較されるかは不明です。
この研究では、テキストと KG の位置合わせに対する現在のアプローチをレビューし、手動で作成されたグラフが利用可能な 2 つのデータセットでそれらを評価することで、この知識のギャップを埋めることを試み、現在の方法の有効性についての洞察を提供します。

要約(オリジナル)

In contrast to large text corpora, knowledge graphs (KG) provide dense and structured representations of factual information. This makes them attractive for systems that supplement or ground the knowledge found in pre-trained language models with an external knowledge source. This has especially been the case for classification tasks, where recent work has focused on creating pipeline models that retrieve information from KGs like ConceptNet as additional context. Many of these models consist of multiple components, and although they differ in the number and nature of these parts, they all have in common that for some given text query, they attempt to identify and retrieve a relevant subgraph from the KG. Due to the noise and idiosyncrasies often found in KGs, it is not known how current methods compare to a scenario where the aligned subgraph is completely relevant to the query. In this work, we try to bridge this knowledge gap by reviewing current approaches to text-to-KG alignment and evaluating them on two datasets where manually created graphs are available, providing insights into the effectiveness of current methods.

arxiv情報

著者 Sondre Wold,Lilja Øvrelid,Erik Velldal
発行日 2023-06-05 13:45:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク