Disjointness Violations in Wikidata

要約

素性チェックはナレッジ ベースで最も重要な制約チェックの 1 つであり、誤ったステートメントや内部矛盾を検出して修正するのに役立ちます。
ウィキデータは、コミュニティが管理する非常に大規模な知識ベースです。
ウィキデータには、そのサイズと構造の両方により、多くの誤った記述と内部矛盾が含まれています。
私たちはウィキデータ上の現在の素性のモデリングを分析し、これらの素性違反を引き起こすパターンを特定し、それらを分類します。
SPARQL クエリを使用して、素性違反を引き起こしている各「犯人」を特定し、矛盾する情報を特定して修正するための式をレイアウトします。
最後に、将来的にウィキデータで不整合情報をより適切にモデル化および拡張できる方法について説明します。

要約(オリジナル)

Disjointness checks are among the most important constraint checks in a knowledge base and can be used to help detect and correct incorrect statements and internal contradictions. Wikidata is a very large, community-managed knowledge base. Because of both its size and construction, Wikidata contains many incorrect statements and internal contradictions. We analyze the current modeling of disjointness on Wikidata, identify patterns that cause these disjointness violations and categorize them. We use SPARQL queries to identify each “culprit” causing a disjointness violation and lay out formulas to identify and fix conflicting information. We finally discuss how disjointness information could be better modeled and expanded in Wikidata in the future.

arxiv情報

著者 Ege Atacan Doğan,Peter F. Patel-Schneider
発行日 2024-10-17 16:07:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク