Explaining k-Nearest Neighbors: Abductive and Counterfactual Explanations

要約

$k$-最近傍法は分類モデルとして広く使用されているにもかかわらず、その説明可能性の特性は理論的な観点からはほとんど理解されていません。
最近傍分類器は「データの観点」からの解釈可能性を提供します。つまり、入力ベクトル $\bar{x}$ の分類は、ベクトル $\bar{v}_1、\ldots、\bar{v} を識別することによって説明されます。
$\bar{x}$ の分類を決定するトレーニング セット内の _k$ について、各ベクトルが数百または数千の特徴を持ち、それらの関連性が明らかでない高次元アプリケーションでは、そのような説明は非現実的になる可能性があると私たちは主張します。
重要性は。
したがって、私たちは「特徴の観点」を通じて最近傍分類を理解することに焦点を当てます。その目標は、$\bar{x}$ の特徴の値がその分類にどのように影響するかを特定することです。
具体的には、分類を保証するのに十分な $\bar{x}$ の特徴の集合に対応する「最小限の十分な理由」や、最小距離特徴の変化に基づく「反事実的説明」などのアブダクティブな説明を研究します。
分類を変更するには $\bar{x}$ を実行する必要があります。
離散特徴空間と連続特徴空間を区別し、関与する距離関数の選択の影響を考慮しながら、反事実的およびアブダクティブな説明に対する肯定的および否定的な複雑さの結果の詳細な状況を提示します。
最後に、負の複雑さの結果がいくつかあるにもかかわらず、整数二次計画法と SAT 解法によって実際の計算による説明が可能であることを示します。

要約(オリジナル)

Despite the wide use of $k$-Nearest Neighbors as classification models, their explainability properties remain poorly understood from a theoretical perspective. While nearest neighbors classifiers offer interpretability from a ‘data perspective’, in which the classification of an input vector $\bar{x}$ is explained by identifying the vectors $\bar{v}_1, \ldots, \bar{v}_k$ in the training set that determine the classification of $\bar{x}$, we argue that such explanations can be impractical in high-dimensional applications, where each vector has hundreds or thousands of features and it is not clear what their relative importance is. Hence, we focus on understanding nearest neighbor classifications through a ‘feature perspective’, in which the goal is to identify how the values of the features in $\bar{x}$ affect its classification. Concretely, we study abductive explanations such as ‘minimum sufficient reasons’, which correspond to sets of features in $\bar{x}$ that are enough to guarantee its classification, and ‘counterfactual explanations’ based on the minimum distance feature changes one would have to perform in $\bar{x}$ to change its classification. We present a detailed landscape of positive and negative complexity results for counterfactual and abductive explanations, distinguishing between discrete and continuous feature spaces, and considering the impact of the choice of distance function involved. Finally, we show that despite some negative complexity results, Integer Quadratic Programming and SAT solving allow for computing explanations in practice.

arxiv情報

著者 Pablo Barceló,Alexander Kozachinskiy,Miguel Romero Orth,Bernardo Subercaseaux,José Verschae
発行日 2025-01-10 16:14:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク