Shapley Curves: A Smoothing Perspective

要約

協力ゲーム理論に由来するシャプレー値は、機械学習の応用において、変数の重要度を示す最も広く使われる尺度のひとつとなっている。しかし、シャプレー値の統計的理解はまだ限られている。本稿では、変数の重要度の局所的尺度としてシャプレー曲線を導入することで、ノンパラメトリック(あるいは平滑化)の観点を取り入れる。我々は2つの推定戦略を提案し、特徴間の独立性と依存性の両方における一貫性と漸近正規性を導出する。これにより、信頼区間を構築し、推定されたシャプレー曲線に対して推論を行うことができる。我々は、Shapley曲線の有限標本被覆率が良くなるように特別に調整した、新しいバージョンの野生ブートストラップ法を提案する。漸近結果は、広範な実験により検証される。実証的な応用として、どの属性が自動車の価格を駆動するかを分析する。

要約(オリジナル)

Originating from cooperative game theory, Shapley values have become one of the most widely used measures for variable importance in applied Machine Learning. However, the statistical understanding of Shapley values is still limited. In this paper, we take a nonparametric (or smoothing) perspective by introducing Shapley curves as a local measure of variable importance. We propose two estimation strategies and derive the consistency and asymptotic normality both under independence and dependence among the features. This allows us to construct confidence intervals and conduct inference on the estimated Shapley curves. We propose a novel version of the wild bootstrap procedure, specifically adjusted to give good finite sample coverage of the Shapley curves. The asymptotic results are validated in extensive experiments. In an empirical application, we analyze which attributes drive the prices of vehicles.

arxiv情報

著者 Ratmir Miftachov,Georg Keilbar,Wolfgang Karl Härdle
発行日 2023-07-03 14:15:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク