要約
データベース クエリの結果が得られる理由を説明することは、Explainable AI の目標に向けた重要なタスクです。特に、Datalog などの表現力豊かなデータベース クエリ言語がオントロジー ベースのアプリケーションの開発において重要な役割を果たしている今日では特にそうです。
クエリの結果を説明する標準的な方法は、いわゆる理由の由来です。これは本質的に、その結果を導き出すのに十分な入力データベースのサブセットの形式で、証人に関する情報をクエリの結果に提供します。
驚いたことに、Datalog クエリの理由と出所の概念は何十年にもわたって存在し、集中的に研究されてきたという事実にもかかわらず、その計算の複雑さは未踏のままです。
この作業の目標は、理由と出所の文献におけるこの明らかなギャップを埋めることです。
この目的に向けて、Datalog クエリとその主要なサブクラスの理由と出所のデータの複雑さを特定します。
私たちの仕事の要点は、たとえ再帰が線形に制限されていたとしても、再帰クエリのWhy-起源は扱いにくい問題ですが、非再帰クエリの場合は非常に扱いやすいということです。
そうは言っても、SAT ソルバーを活用することで、(再帰的な) Datalog クエリの理由と出所を実際に機能させることは、非現実的な目標ではないことを実験的に確認しています。
要約(オリジナル)
Explaining why a database query result is obtained is an essential task towards the goal of Explainable AI, especially nowadays where expressive database query languages such as Datalog play a critical role in the development of ontology-based applications. A standard way of explaining a query result is the so-called why-provenance, which essentially provides information about the witnesses to a query result in the form of subsets of the input database that are sufficient to derive that result. To our surprise, despite the fact that the notion of why-provenance for Datalog queries has been around for decades and intensively studied, its computational complexity remains unexplored. The goal of this work is to fill this apparent gap in the why-provenance literature. Towards this end, we pinpoint the data complexity of why-provenance for Datalog queries and key subclasses thereof. The takeaway of our work is that why-provenance for recursive queries, even if the recursion is limited to be linear, is an intractable problem, whereas for non-recursive queries is highly tractable. Having said that, we experimentally confirm, by exploiting SAT solvers, that making why-provenance for (recursive) Datalog queries work in practice is not an unrealistic goal.
arxiv情報
著者 | Marco Calautti,Ester Livshits,Andreas Pieris,Markus Schneider |
発行日 | 2023-03-22 17:37:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google