KIF: A Framework for Virtual Integration of Heterogeneous Knowledge Bases using Wikidata

要約

ウィキデータを共通語として使用して異種の知識ベースを統合する知識統合フレームワーク (KIF と呼ばれる) を紹介します。
これらは、トリプルストア、リレーショナル データベース、CSV ファイルなどであり、RDF の Wikidata 言語を使用する場合と使用しない場合があります。
KIF は、ウィキデータのデータ モデルと語彙に加え、ユーザー定義のマッピングを活用して、記述のコンテキストと来歴を追跡しながら、統合されたベースの統一されたビューを公開します。
その結果、「拡張ウィキデータ」のように動作し、効率的なフィルター インターフェイスまたは SPARQL を使用してクエリできる仮想ナレッジ ベースが作成されます。
KIF の設計と実装を紹介し、化学分野 (Wikidata、PubChem、IBM CIRCA を含む) における実際の統合問題を解決するために KIF をどのように使用したかについて説明し、KIF のパフォーマンスとオーバーヘッドに関する実験結果を示します。

要約(オリジナル)

We present a knowledge integration framework (called KIF) that uses Wikidata as a lingua franca to integrate heterogeneous knowledge bases. These can be triplestores, relational databases, CSV files, etc., which may or may not use the Wikidata dialect of RDF. KIF leverages Wikidata’s data model and vocabulary plus user-defined mappings to expose a unified view of the integrated bases while keeping track of the context and provenance of their statements. The result is a virtual knowledge base which behaves like an ‘extended Wikidata’ and which can be queried either through an efficient filter interface or using SPARQL. We present the design and implementation of KIF, discuss how we have used it to solve a real integration problem in the domain of chemistry (involving Wikidata, PubChem, and IBM CIRCA), and present experimental results on the performance and overhead of KIF.

arxiv情報

著者 Guilherme Lima,Marcelo Machado,Elton Soares,Sandro R. Fiorini,Raphael Thiago,Leonardo G. Azevedo,Viviane T. da Silva,Renato Cerqueira
発行日 2024-03-15 13:46:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB パーマリンク