Expected Shapley-Like Scores of Boolean Functions: Complexity and Applications to Probabilistic Databases


ゲーム理論に由来し、説明可能な AI でますます顕著になっている Shapley 値は、Banzhaf 値などの他の同様の検出力指数とともに、データベース上のクエリ応答における事実の寄与を評価するために提案されています。
この研究では、これらの Shapley のようなスコアを確率的設定に適応させ、その期待値を計算することが目的です。
我々は、Shapley の期待値とブール関数の期待値の計算が多項式時間で相互還元可能であり、したがって同じ扱いやすい状況が得られることを示します。
私たちは、データベースの来歴と ProvSQL システム内でのこのアルゴリズムの効果的な実装を通じて確率的データベースへのアプリケーションを提示し、標準ベンチマークに対する実現可能性を実験的に検証します。


Shapley values, originating in game theory and increasingly prominent in explainable AI, have been proposed to assess the contribution of facts in query answering over databases, along with other similar power indices such as Banzhaf values. In this work we adapt these Shapley-like scores to probabilistic settings, the objective being to compute their expected value. We show that the computations of expected Shapley values and of the expected values of Boolean functions are interreducible in polynomial time, thus obtaining the same tractability landscape. We investigate the specific tractable case where Boolean functions are represented as deterministic decomposable circuits, designing a polynomial-time algorithm for this setting. We present applications to probabilistic databases through database provenance, and an effective implementation of this algorithm within the ProvSQL system, which experimentally validates its feasibility over a standard benchmark.


著者 Pratik Karmakar,Mikaël Monet,Pierre Senellart,Stéphane Bressan
発行日 2024-01-12 10:34:31+00:00
arxivサイト arxiv_id(pdf)

