SHAP-IQ: Unified Approximation of any-order Shapley Interactions

要約

主に説明可能な人工知能 (XAI) の研究では、シャプレー値 (SV) を適用して、ブラック ボックス モデルの特徴重要度スコアを決定します。
Shapley 相互作用インデックスは、Shapley 値を拡張して、任意次数の特徴相互作用スコアを定義します。
一意の Shapley 相互作用指数を定義することは未解決の研究課題であり、これまでのところ、公理の選択によって異なる 3 つの定義が提案されています。
さらに、各定義には特定の近似手法が必要です。
ただし、SHAPley Interaction Quantification (SHAP-IQ) は、線形性、対称性、およびダミー公理を満たす他のすべての定義と同様に、3 つの定義すべてについて Shapley 相互作用を計算するための効率的なサンプリング ベースの近似器です。
SHAP-IQ は新しい表現に基づいており、既存の方法とは対照的に、その近似品質の理論的保証と、点推定の分散の推定を提供します。
SV の特殊なケースでは、私たちのアプローチは SV の新しい表現を明らかにし、非常に単純化された計算で Unbiased KernelSHAP に対応します。
高次元の合成モデルの中で最先端の言語モデルを説明することにより、計算効率と有効性を示します。

要約(オリジナル)

Predominately in explainable artificial intelligence (XAI) research, the Shapley value (SV) is applied to determine feature importance scores for any black box model. Shapley interaction indices extend the Shapley value to define any-order feature interaction scores. Defining a unique Shapley interaction index is an open research question and, so far, three definitions have been proposed, which differ by their choice of axioms. Moreover, each definition requires a specific approximation technique. We, however, propose SHAPley Interaction Quantification (SHAP-IQ), an efficient sampling-based approximator to compute Shapley interactions for all three definitions, as well as all other that satisfy the linearity, symmetry and dummy axiom. SHAP-IQ is based on a novel representation and, in contrast to existing methods, we provide theoretical guarantees for its approximation quality, as well as estimates for the variance of the point estimates. For the special case of SV, our approach reveals a novel representation of the SV and corresponds to Unbiased KernelSHAP with a greatly simplified calculation. We illustrate the computational efficiency and effectiveness by explaining state-of-the-art language models among high-dimensional synthetic models.

arxiv情報

著者 Fabian Fumagalli,Maximilian Muschalik,Patrick Kolpaczki,Eyke Hüllermeier,Barbara Hammer
発行日 2023-03-02 11:49:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク