An Efficient Shapley Value Computation for the Naive Bayes Classifier

要約

機械学習モデルへの入力変数の変数選択または重要性の測定は、多くの研究の焦点となっています。
優れたモデルを持つだけではもはや十分ではなく、その決定を説明する必要もあります。
これが、現在非常に多くの明瞭度アルゴリズムが利用可能な理由です。
このうち、Shapley 値推定アルゴリズムは、協調ゲーム理論に基づいた明瞭度手法です。
単純ベイズ分類器の場合、私たちの知る限り、シャプレー値の「分析的」定式化はありません。
この記事では、単純ベイズ分類器の特殊なケースにおけるシャプレー値の正確な分析表現を提案します。
私たちは、この Shapley 提案を、別の頻繁に使用される指標である証拠の重み (WoE) と分析的に比較し、(i) WoE および (ii) 実世界のデータセットでの KernelShap の結果と私たちの提案を実証的に比較し、類似した結果と類似していない結果について議論します。

結果は、単純ベイズ分類器に対する Shapley 提案が、アルゴリズムの複雑さが低くても有益な結果を提供するため、非常に短い計算時間で非常に大規模なデータセットに使用できることを示しています。

要約(オリジナル)

Variable selection or importance measurement of input variables to a machine learning model has become the focus of much research. It is no longer enough to have a good model, one also must explain its decisions. This is why there are so many intelligibility algorithms available today. Among them, Shapley value estimation algorithms are intelligibility methods based on cooperative game theory. In the case of the naive Bayes classifier, and to our knowledge, there is no “analytical’ formulation of Shapley values. This article proposes an exact analytic expression of Shapley values in the special case of the naive Bayes Classifier. We analytically compare this Shapley proposal, to another frequently used indicator, the Weight of Evidence (WoE) and provide an empirical comparison of our proposal with (i) the WoE and (ii) KernelShap results on real world datasets, discussing similar and dissimilar results. The results show that our Shapley proposal for the naive Bayes classifier provides informative results with low algorithmic complexity so that it can be used on very large datasets with extremely low computation time.

arxiv情報

著者 Vincent Lemaire,Fabrice Clérot,Marc Boullé
発行日 2023-07-31 14:39:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク