Model agnostic local variable importance for locally dependent relationships

要約

グローバル変数の重要度測定は、機械学習モデルの結果を解釈するために一般的に使用されます。
ローカル変数重要度手法は、変数がデータセット全体ではなく個々の観測にどのように寄与するかを評価します。
現在の方法は通常、変数間の局所的な依存関係を正確に反映できず、代わりに限界重要度の値に焦点を当てています。
さらに、これらはマルチクラス分類問題にネイティブに適応されていません。
我々は、ローカル変数の重要性を計算するための新しいモデルに依存しない手法 CLIQUE を提案します。この手法は、ローカルに依存する関係を捉え、順列ベースの手法を改良し、マルチクラス分類問題に直接適用できます。
シミュレートされた例と実際の例は、CLIQUE が局所的に依存する情報を強調し、変数が応答に影響を及ぼさない領域のバイアスを適切に低減することを示しています。

要約(オリジナル)

Global variable importance measures are commonly used to interpret machine learning model results. Local variable importance techniques assess how variables contribute to individual observations rather than the entire dataset. Current methods typically fail to accurately reflect locally dependent relationships between variables and instead focus on marginal importance values. Additionally, they are not natively adapted for multi-class classification problems. We propose a new model-agnostic method for calculating local variable importance, CLIQUE, that captures locally dependent relationships, contains improvements over permutation-based methods, and can be directly applied to multi-class classification problems. Simulated and real-world examples show that CLIQUE emphasizes locally dependent information and properly reduces bias in regions where variables do not affect the response.

arxiv情報

著者 Kelvyn K. Bladen,Adele Cutler,D. Richard Cutler,Kevin R. Moon
発行日 2024-11-13 17:59:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO, stat.ML パーマリンク