From Shapes to Shapes: Inferring SHACL Shapes for Results of SPARQL CONSTRUCT Queries (Extended Version)

要約

SPARQL CONSTRUCT クエリを使用すると、指定された入力グラフを新しい出力グラフに変換するデータ処理パイプラインの仕様が可能になります。
現在では、SHACL 形状を通じてグラフを制限することが一般的になっており、ユーザーはどのデータが期待できるのか、どのデータが期待できないのかを理解できるようになります。
ただし、特定の入力データを知らずに、データ処理パイプラインの最後にどのようなグラフ データが予想されるかを理解することは困難になります。入力グラフの形状制約は出力グラフに影響を与える可能性がありますが、文字通り適用されなくなり、新しい形状が適用される可能性があります。
クエリ テンプレートによって強制される可能性があります。
このペーパーでは、特定の SPARQL CONSTRUCT クエリのすべての可能な出力グラフに保持される形状制約の導出について研究します。
SPARQL CONSTRUCT クエリは固定されている、たとえばプログラムの一部であると仮定しますが、入力グラフは入力形状の制約に従いますが、時間の経過とともに変化する可能性があるため、ほとんどが不明です。
SPARQL CONSTRUCT クエリ (SCCQ) のフラグメントと SHACL (Simple SHACL) のフラグメントを研究します。
与えられた単純 SHACL 形状のセットによって制限される入力グラフに対する SCCQ の評価結果を制約する、最も制限の厳しい単純 SHACL 形状のセットを導出する問題を正式に定義します。
入力されたSHACL形状とCONSTRUCTクエリを静的に分析するアルゴリズムを提案および実装し、その健全性と複雑性を証明します。

要約(オリジナル)

SPARQL CONSTRUCT queries allow for the specification of data processing pipelines that transform given input graphs into new output graphs. It is now common to constrain graphs through SHACL shapes allowing users to understand which data they can expect and which not. However, it becomes challenging to understand what graph data can be expected at the end of a data processing pipeline without knowing the particular input data: Shape constraints on the input graph may affect the output graph, but may no longer apply literally, and new shapes may be imposed by the query template. In this paper, we study the derivation of shape constraints that hold on all possible output graphs of a given SPARQL CONSTRUCT query. We assume that the SPARQL CONSTRUCT query is fixed, e.g., being part of a program, whereas the input graphs adhere to input shape constraints but may otherwise vary over time and, thus, are mostly unknown. We study a fragment of SPARQL CONSTRUCT queries (SCCQ) and a fragment of SHACL (Simple SHACL). We formally define the problem of deriving the most restrictive set of Simple SHACL shapes that constrain the results from evaluating a SCCQ over any input graph restricted by a given set of Simple SHACL shapes. We propose and implement an algorithm that statically analyses input SHACL shapes and CONSTRUCT queries and prove its soundness and complexity.

arxiv情報

著者 Philipp Seifer,Daniel Hernández,Ralf Lämmel,Steffen Staab
発行日 2024-02-13 15:04:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LO パーマリンク