Generating collective counterfactual explanations in score-based classification via mathematical optimization

要約

一か八かの意思決定の場面で機械学習モデルの使用が増えているため、モデルがどのように意思決定に至るかを理解するツールを持つことがますます重要になっています。
トレーニングされた教師あり分類モデルを仮定すると、反事実分析を通じて説明を取得できます。インスタンスの反事実説明は、摂動されたインスタンスが機械学習分類モデルによって目的のクラスに分類されるように、このインスタンスを最小限に変更する方法を示します。
反事実分析の文献のほとんどは、単一インスタンスの単一反事実設定に焦点を当てており、単一の説明を提供するために 1 つの単一インスタンスに対して分析が行われます。
本稿では、利害関係者の視点に立って、いわゆる集団的反事実説明を紹介します。
新しい数学的最適化モデルを使用して、関心のあるグループ内の各インスタンスに反事実的な説明を提供し、摂動の総コストがいくつかのリンク制約の下で最小化されるようにします。
反事実を構築するプロセスを個人ではなく集合的に行うことで、データセット全体にとって重要な特徴を検出して、個人を目的のクラスに分類できるようになります。
私たちの方法論では、一部のインスタンスを個別に処理し、対象グループの記録の一部に対して集合的な反事実分析を実行することができます。
このようにして、外れ値が特定され、適切に処理されます。
分類器および反事実が求められる空間に関するいくつかの仮定の下では、集合的な反事実を見つけることは、凸二次の線形制約付き混合整数最適化問題を解くことに帰着します。これは、中程度のサイズのデータ​​セットの場合、既存のソルバーを使用して最適化するまで解くことができます。
私たちのアプローチのパフォーマンスは現実世界のデータセットで示されており、その有用性が実証されています。

要約(オリジナル)

Due to the increasing use of Machine Learning models in high stakes decision making settings, it has become increasingly important to have tools to understand how models arrive at decisions. Assuming a trained Supervised Classification model, explanations can be obtained via counterfactual analysis: a counterfactual explanation of an instance indicates how this instance should be minimally modified so that the perturbed instance is classified in the desired class by the Machine Learning classification model. Most of the Counterfactual Analysis literature focuses on the single-instance single-counterfactual setting, in which the analysis is done for one single instance to provide one single explanation. Taking a stakeholder’s perspective, in this paper we introduce the so-called collective counterfactual explanations. By means of novel Mathematical Optimization models, we provide a counterfactual explanation for each instance in a group of interest, so that the total cost of the perturbations is minimized under some linking constraints. Making the process of constructing counterfactuals collective instead of individual enables us to detect the features that are critical to the entire dataset to have the individuals classified in the desired class. Our methodology allows for some instances to be treated individually, performing the collective counterfactual analysis for a fraction of records of the group of interest. This way, outliers are identified and handled appropriately. Under some assumptions on the classifier and the space in which counterfactuals are sought, finding collective counterfactuals is reduced to solving a convex quadratic linearly constrained mixed integer optimization problem, which, for datasets of moderate size, can be solved to optimality using existing solvers. The performance of our approach is illustrated on real-world datasets, demonstrating its usefulness.

arxiv情報

著者 Emilio Carrizosa,Jasone Ramírez-Ayerbe,Dolores Romero Morales
発行日 2023-10-19 15:18:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク