shapr: Explaining Machine Learning Models with Conditional Shapley Values in R and Python

要約

このペーパーでは、RとPythonの両方で機械学習と統計回帰モデルのShapley価値の説明を生成するための汎用性の高いツールであるSHAPRパッケージを紹介します。
このパッケージは、条件付きShapley値の推定値を強調し、機能を正確にキャプチャするための包括的なアプローチを提供します。これは、正しいモデル解釈と同様のソフトウェアに欠けているために重要です。
通常の表形式データに加えて、SHAPR Rパッケージには、時系列予測を説明するための特殊な機能が含まれています。
このパッケージは、ほとんどのユースケースで賢明なデフォルトを備えた最小限のユーザー機能セットを提供し、高度なユーザーが計算を微調整するための広範な柔軟性を提供します。
その他の機能には、並列化された計算、収束検出による反復推定、および豊富な視覚化ツールが含まれます。
SHAPRは、因果情報が利用可能な場合、因果関係と非対称Shapley値を計算するために機能を拡張します。
さらに、SHAPRのコア機能をPythonエコシステムにもたらすShaprpy Pythonライブラリを紹介します。
全体として、このパッケージは、強力でユーザーフレームワーク内の予測モデルの解釈可能性を高めることを目的としています。

要約(オリジナル)

This paper introduces the shapr package, a versatile tool for generating Shapley value explanations for machine learning and statistical regression models in both R and Python. The package emphasizes conditional Shapley value estimates, providing a comprehensive range of approaches for accurately capturing feature dependencies, which is crucial for correct model interpretation and lacking in similar software. In addition to regular tabular data, the shapr R-package includes specialized functionality for explaining time series forecasts. The package offers a minimal set of user functions with sensible defaults for most use cases while providing extensive flexibility for advanced users to fine-tune computations. Additional features include parallelized computations, iterative estimation with convergence detection, and rich visualization tools. shapr also extends its functionality to compute causal and asymmetric Shapley values when causal information is available. In addition, we introduce the shaprpy Python library, which brings core capabilities of shapr to the Python ecosystem. Overall, the package aims to enhance the interpretability of predictive models within a powerful and user-friendly framework.

arxiv情報

著者 Martin Jullum,Lars Henry Berge Olsen,Jon Lachmann,Annabelle Redelmeier
発行日 2025-04-02 15:47:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO パーマリンク