On the Connection between Game-Theoretic Feature Attributions and Counterfactual Explanations

要約

説明可能な人工知能 (XAI) は近年広く関心を集めており、最も人気のあるタイプの説明の 2 つは、特徴の帰属と反事実的な説明です。
これらのクラスのアプローチは主に独立して研究されており、それらを調和させるためのいくつかの試みは主に経験に基づいています。
この研究は、SHAP に焦点を当てていますがそれに限定されない、ゲーム理論的な特徴の帰属と反事実の説明との間の明確な理論的つながりを確立します。
特徴の帰属と反事実の説明に基づいてシャプレーの価値観を操作的に変更する動機を与えた後、条件下ではそれらが実際に同等であることを証明します。
次に、等価性の結果をシャプレーの値を超えてゲーム理論的な解の概念に拡張します。
さらに、そのような等価性の条件の分析を通じて、機能の重要性を提供するために反事実的な説明を素朴に使用することの限界を明らかにしました。
3 つのデータセットの実験では、2 つのアプローチ間の関係のあらゆる段階での説明の違いが定量的に示され、理論的発見が裏付けられます。

要約(オリジナル)

Explainable Artificial Intelligence (XAI) has received widespread interest in recent years, and two of the most popular types of explanations are feature attributions, and counterfactual explanations. These classes of approaches have been largely studied independently and the few attempts at reconciling them have been primarily empirical. This work establishes a clear theoretical connection between game-theoretic feature attributions, focusing on but not limited to SHAP, and counterfactuals explanations. After motivating operative changes to Shapley values based feature attributions and counterfactual explanations, we prove that, under conditions, they are in fact equivalent. We then extend the equivalency result to game-theoretic solution concepts beyond Shapley values. Moreover, through the analysis of the conditions of such equivalence, we shed light on the limitations of naively using counterfactual explanations to provide feature importances. Experiments on three datasets quantitatively show the difference in explanations at every stage of the connection between the two approaches and corroborate the theoretical findings.

arxiv情報

著者 Emanuele Albini,Shubham Sharma,Saumitra Mishra,Danial Dervovic,Daniele Magazzeni
発行日 2023-07-13 17:57:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GT, cs.HC, cs.LG, I.2 パーマリンク