On the Complexity of SHAP-Score-Based Explanations: Tractability via Knowledge Compilation and Non-Approximability Results

要約

機械学習では、$\mathsf{SHAP}$ スコアは Shapley 値のバージョンであり、すべての機能にスコアを割り当てることによって、特定のエンティティで学習したモデルの結果を説明するために使用されます。
一般に、Shapley 値の計算は扱いにくい問題ですが、$\mathsf{SHAP}$ スコアが決定論的で分解可能なブール回路上で多項式時間で計算できることを示す強力な肯定的な結果を証明します。
このような回路は、ナレッジ コンパイルの分野で研究されており、二分決定木や順序付き二分決定図 (OBDD) など、広範なブール回路と二分決定図のクラスを一般化しています。
また、ブール モデルのクラスで計算することは、そのクラスのモデル カウント問題と同じくらい常に多項式的に難しいことを観察することによって、SHAP スコアの計算限界を確立します。
これは、決定論と分解可能性の両方が、私たちが検討する回路にとって不可欠な特性であることを意味します。
また、$\mathsf{SHAP}$ スコアの計算は、DNF の命題式のクラスよりも扱いにくいことも意味します。
この否定的な結果に基づいて、そのようなクラスの $\mathsf{SHAP}$ スコアを計算するための完全多項式ランダム化近似スキーム (FPRAS) の存在を探します。
FPRAS を認める DNF 式のモデル カウント問題とは対照的に、$\mathsf{SHAP}$ スコアの計算にはそのような FPRAS が存在しないことを証明します。
驚くべきことに、この否定的な結果は、DNF の単調な式のクラスにも当てはまります。
これらの手法は、別の強力な否定的な結果を証明するためにさらに拡張できます。広く信じられている複雑さの仮定の下では、単調な DNF 式 $\varphi$ と機能 $x,y$ が与えられた場合に、$\
$\varphi$ の $x$ の mathsf{SHAP}$ スコアは、$\varphi$ の $y$ の $\mathsf{SHAP}$ スコアよりも小さいです。

要約(オリジナル)

In Machine Learning, the $\mathsf{SHAP}$-score is a version of the Shapley value that is used to explain the result of a learned model on a specific entity by assigning a score to every feature. While in general computing Shapley values is an intractable problem, we prove a strong positive result stating that the $\mathsf{SHAP}$-score can be computed in polynomial time over deterministic and decomposable Boolean circuits. Such circuits are studied in the field of Knowledge Compilation and generalize a wide range of Boolean circuits and binary decision diagrams classes, including binary decision trees and Ordered Binary Decision Diagrams (OBDDs). We also establish the computational limits of the SHAP-score by observing that computing it over a class of Boolean models is always polynomially as hard as the model counting problem for that class. This implies that both determinism and decomposability are essential properties for the circuits that we consider. It also implies that computing $\mathsf{SHAP}$-scores is intractable as well over the class of propositional formulas in DNF. Based on this negative result, we look for the existence of fully-polynomial randomized approximation schemes (FPRAS) for computing $\mathsf{SHAP}$-scores over such class. In contrast to the model counting problem for DNF formulas, which admits an FPRAS, we prove that no such FPRAS exists for the computation of $\mathsf{SHAP}$-scores. Surprisingly, this negative result holds even for the class of monotone formulas in DNF. These techniques can be further extended to prove another strong negative result: Under widely believed complexity assumptions, there is no polynomial-time algorithm that checks, given a monotone DNF formula $\varphi$ and features $x,y$, whether the $\mathsf{SHAP}$-score of $x$ in $\varphi$ is smaller than the $\mathsf{SHAP}$-score of $y$ in $\varphi$.

arxiv情報

著者 Marcelo Arenas,Pablo Barceló,Leopoldo Bertossi,Mikaël Monet
発行日 2023-03-30 08:43:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CC パーマリンク