GeoShapley: A Game Theory Approach to Measuring Spatial Effects in Machine Learning Models

要約

この論文では、機械学習モデルの空間効果を測定するゲーム理論のアプローチである GeoShapley を紹介します。
GeoShapley は、位置をモデル予測ゲームのプレーヤーとして概念化することで、ゲーム理論におけるノーベル賞を受賞した Shapley 価値フレームワークを拡張します。これにより、位置の重要性と、位置とモデル内の他の特徴の間の相乗効果の定量化が可能になります。
GeoShapley はモデルに依存しないアプローチであり、さまざまな構造の統計モデルまたはブラックボックス機械学習モデルに適用できます。
GeoShapley の解釈は、空間効果を説明するための空間的に変化する係数モデルと、非空間効果を説明するための加算モデルに直接リンクされています。
シミュレートされたデータを使用して、GeoShapley 値は既知のデータ生成プロセスに対して検証され、7 つの統計および機械学習モデルの相互比較に使用されます。
住宅価格モデリングの実証例を使用して、GeoShapley の有用性と現実世界のデータによる解釈を説明します。
このメソッドは、geoshapley という名前のオープンソース Python パッケージとして入手できます。

要約(オリジナル)

This paper introduces GeoShapley, a game theory approach to measuring spatial effects in machine learning models. GeoShapley extends the Nobel Prize-winning Shapley value framework in game theory by conceptualizing location as a player in a model prediction game, which enables the quantification of the importance of location and the synergies between location and other features in a model. GeoShapley is a model-agnostic approach and can be applied to statistical or black-box machine learning models in various structures. The interpretation of GeoShapley is directly linked with spatially varying coefficient models for explaining spatial effects and additive models for explaining non-spatial effects. Using simulated data, GeoShapley values are validated against known data-generating processes and are used for cross-comparison of seven statistical and machine learning models. An empirical example of house price modeling is used to illustrate GeoShapley’s utility and interpretation with real world data. The method is available as an open-source Python package named geoshapley.

arxiv情報

著者 Ziqi Li
発行日 2023-12-06 18:39:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク