Construction of Knowledge Graphs: State and Challenges

要約

レコメンダー システムや質問応答などの多数のアプリケーションの中心にナレッジ グラフ (KG) があるため、そのような KG を構築して継続的に更新するための一般化されたパイプラインの必要性が高まっています。
非構造化データ ソース (テキストなど) および構造化データ ソース (データベースなど) から KG を作成するために必要な個々の手順は、1 回限りの実行について十分に研究されていますが、増分 KG 更新への採用と個々の手順の相互作用については、
これまで体系的に調査されたことはほとんどありませんでした。
この作業では、最初に KG の主要なグラフ モデルについて説明し、将来の KG 構築パイプラインの主要な要件を紹介します。
次に、メタデータ管理、オントロジー開発、品質保証などの分野横断的なトピックを含む、高品質の KG を構築するために必要な手順の概要を説明します。
次に、特定の一般的な KG に導入された要件と、KG 構築のための最近のツールと戦略について、KG 構築の最新技術を評価します。
最後に、さらなる研究と改善が必要な領域を特定します。

要約(オリジナル)

With knowledge graphs (KGs) at the center of numerous applications such as recommender systems and question answering, the need for generalized pipelines to construct and continuously update such KGs is increasing. While the individual steps that are necessary to create KGs from unstructured (e.g. text) and structured data sources (e.g. databases) are mostly well-researched for their one-shot execution, their adoption for incremental KG updates and the interplay of the individual steps have hardly been investigated in a systematic manner so far. In this work, we first discuss the main graph models for KGs and introduce the major requirement for future KG construction pipelines. Next, we provide an overview of the necessary steps to build high-quality KGs, including cross-cutting topics such as metadata management, ontology development, and quality assurance. We then evaluate the state of the art of KG construction w.r.t the introduced requirements for specific popular KGs as well as some recent tools and strategies for KG construction. Finally, we identify areas in need of further research and improvement.

arxiv情報

著者 Marvin Hofer,Daniel Obraczka,Alieh Saeedi,Hanna Köpcke,Erhard Rahm
発行日 2023-02-22 17:26:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LG パーマリンク