Stabilizing Estimates of Shapley Values with Control Variates

要約

Shapley 値は、ブラックボックス機械学習モデルの予測を説明するための最も人気のあるツールの 1 つです。
ただし、計算コストが高いため、サンプリング近似が使用され、かなりの不確実性が生じます。
これらのモデルの説明を安定させるために、制御変数のモンテカルロ手法に基づくアプローチである ControlSHAP を提案します。
私たちの方法論はあらゆる機械学習モデルに適用でき、追加の計算やモデリングの労力は事実上必要ありません。
いくつかの高次元データセットでは、Shapley 推定値のモンテカルロ変動が大幅に減少する可能性があることがわかりました。

要約(オリジナル)

Shapley values are among the most popular tools for explaining predictions of blackbox machine learning models. However, their high computational cost motivates the use of sampling approximations, inducing a considerable degree of uncertainty. To stabilize these model explanations, we propose ControlSHAP, an approach based on the Monte Carlo technique of control variates. Our methodology is applicable to any machine learning model and requires virtually no extra computation or modeling effort. On several high-dimensional datasets, we find it can produce dramatic reductions in the Monte Carlo variability of Shapley estimates.

arxiv情報

著者 Jeremy Goldwasser,Giles Hooker
発行日 2023-10-11 17:18:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク