KIF: A Wikidata-Based Framework for Integrating Heterogeneous Knowledge Sources


私たちは、異種知識ソースを仮想的に統合するための、KIF と呼ばれる Wikidata ベースのフレームワークを紹介します。
KIF は Python で書かれており、オープンソースとしてリリースされています。
ウィキデータのデータ モデルと語彙、さらにユーザー定義のマッピングを利用して、記述のコンテキストと来歴を追跡しながら、基礎となるソースの統一されたビューを構築します。
基礎となるソースは、トリプルストア、リレーショナル データベース、CSV ファイルなどで、ウィキデータの語彙や RDF エンコーディングを使用する場合と使用しない場合があります。
最終的に得られるのは、「拡張ウィキデータ」のように動作し、ウィキデータのデータ モデルで定義されたシンプルだが表現力豊かなパターン言語を使用してクエリできる仮想知識ベースです。
この論文では、KIF の設計と実装を紹介し、化学の分野 (Wikidata、PubChem、IBM CIRCA を含む) における実際の統合問題を解決するために KIF をどのように使用したかについて説明し、パフォーマンスとオーバーヘッドに関する実験結果を示します。


We present a Wikidata-based framework, called KIF, for virtually integrating heterogeneous knowledge sources. KIF is written in Python and is released as open-source. It leverages Wikidata’s data model and vocabulary plus user-defined mappings to construct a unified view of the underlying sources while keeping track of the context and provenance of their statements. The underlying sources can be triplestores, relational databases, CSV files, etc., which may or may not use the vocabulary and RDF encoding of Wikidata. The end result is a virtual knowledge base which behaves like an ‘extended Wikidata’ and which can be queried using a simple but expressive pattern language, defined in terms of Wikidata’s data model. In this paper, we present the design and implementation of KIF, discuss how we have used it to solve a real integration problem in the domain of chemistry (involving Wikidata, PubChem, and IBM CIRCA), and present experimental results on the performance and overhead of KIF


著者 Guilherme Lima,João M. B. Rodrigues,Marcelo Machado,Elton Soares,Sandro R. Fiorini,Raphael Thiago,Leonardo G. Azevedo,Viviane T. da Silva,Renato Cerqueira
発行日 2024-07-24 13:43:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.DB パーマリンク