Completeness, Recall, and Negation in Open-World Knowledge Bases: A Survey

要約

汎用知識ベース (KB) は、知識中心の AI の基礎です。
それらの多くは Web ソースから実用的に構築されており、まだ完成には程遠いです。
これは、コンテンツの消費とキュレーションに課題をもたらします。
いくつかの調査は不完全な KB が完了するという問題を対象としていますが、最初の問題はおそらく、そもそも KB が不完全かどうか、どこがどの程度不完全であるかを知ることです。
この調査では、KB 内の完全性、想起、否定に関する知識がどのように表現、抽出、および推論できるかについて説明します。
私たちは、(i) 部分的な閉じた世界のセマンティクスの下での知識表現とクエリの論理的基礎をカバーします。
(ii) 統計パターンによるこの情報の推定。
(iii) KB およびテキストからのリコールに関する情報の抽出。
(iv) 興味深い否定的な記述の特定。
(v) 相対再現の概念を緩和する。
この調査は 2 種類の対象者を対象としています。(1) KB の品質を追跡し、抽出作業に重点を置き、品質を意識した下流アプリケーションを構築することに関心のある実務者。
(2) オープンワールドの前提を超えて知識ベースの最新技術を理解したいと考えているデータ管理、知識ベース、およびセマンティック Web の研究者。
その結果、私たちの調査では、基本的な方法論とその働きの両方を提示し、当面の問題に対してさまざまなアプローチから選択する方法について実践指向の推奨事項を提供します。

要約(オリジナル)

General-purpose knowledge bases (KBs) are a cornerstone of knowledge-centric AI. Many of them are constructed pragmatically from Web sources, and are thus far from complete. This poses challenges for the consumption as well as the curation of their content. While several surveys target the problem of completing incomplete KBs, the first problem is arguably to know whether and where the KB is incomplete in the first place, and to which degree. In this survey we discuss how knowledge about completeness, recall, and negation in KBs can be expressed, extracted, and inferred. We cover (i) the logical foundations of knowledge representation and querying under partial closed-world semantics; (ii) the estimation of this information via statistical patterns; (iii) the extraction of information about recall from KBs and text; (iv) the identification of interesting negative statements; and (v) relaxed notions of relative recall. This survey is targeted at two types of audiences: (1) practitioners who are interested in tracking KB quality, focusing extraction efforts, and building quality-aware downstream applications; and (2) data management, knowledge base and semantic web researchers who wish to understand the state of the art of knowledge bases beyond the open-world assumption. Consequently, our survey presents both fundamental methodologies and their working, and gives practice-oriented recommendations on how to choose between different approaches for a problem at hand.

arxiv情報

著者 Simon Razniewski,Hiba Arnaout,Shrestha Ghosh,Fabian Suchanek
発行日 2023-12-06 12:48:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.DB, cs.DL パーマリンク