Explaining a probabilistic prediction on the simplex with Shapley compositions

要約

ゲーム理論に由来するシャプレー値は、予測に対する各特徴の値の寄与を定量化することで、機械学習モデルの予測を説明するために広く使用されている。これはバイナリ分類のようにスカラー予測を必要とするのに対し、多クラス確率的予測は多次元シンプレックス上に存在する離散確率分布である。このような多クラス設定では、シャプレー値は通常、出力分布の構成的性質を無視して、1対残りの方法で各クラスについて別々に計算される。本論文では、多クラスの確率的予測を適切に説明する根拠のある方法として、シャプレー合成を紹介する。我々は、シャプレー合成が、標準的なシャプレー値の公理的性質を拡張し、Aitchisonシンプレックス上で線形性、対称性、効率性を満たすユニークな量であることを証明する。様々なシナリオにおいて、この適切な多クラス処理を実証する。

要約(オリジナル)

Originating in game theory, Shapley values are widely used for explaining a machine learning model’s prediction by quantifying the contribution of each feature’s value to the prediction. This requires a scalar prediction as in binary classification, whereas a multiclass probabilistic prediction is a discrete probability distribution, living on a multidimensional simplex. In such a multiclass setting the Shapley values are typically computed separately on each class in a one-vs-rest manner, ignoring the compositional nature of the output distribution. In this paper, we introduce Shapley compositions as a well-founded way to properly explain a multiclass probabilistic prediction, using the Aitchison geometry from compositional data analysis. We prove that the Shapley composition is the unique quantity satisfying linearity, symmetry and efficiency on the Aitchison simplex, extending the corresponding axiomatic properties of the standard Shapley value. We demonstrate this proper multiclass treatment in a range of scenarios.

arxiv情報

著者 Paul-Gauthier Noé,Miquel Perelló-Nieto,Jean-François Bonastre,Peter Flach
発行日 2024-08-02 16:40:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.GT, cs.LG パーマリンク