要約
視覚反事実的説明者(VCE)は、画像分類子の透明性を高めるための簡単で有望なアプローチです。
VCESは、機械学習モデルが最も強く応答する特定のデータ変換を明らかにすることにより、機能の帰属などの他のタイプの説明を補完します。
この論文では、既存のVCESがサンプルの品質の最適化や最小限の変化に焦点を絞りすぎると主張しています。
彼らは、忠実さ、理解性、十分性など、説明のために、より全体的なデシデラタを考慮していません。
この欠点に対処するために、反事実的な生成のための新しいメカニズムを探求し、これらのデシデラタの実現にどのように役立つかを調査します。
これらのメカニズムを、新しい「スムーズな反事実的エクスプローラー」(SCE)アルゴリズムに組み合わせて、合成および実際のデータに関する体系的な評価を通じてその有効性を実証します。
要約(オリジナル)
Visual counterfactual explainers (VCEs) are a straightforward and promising approach to enhancing the transparency of image classifiers. VCEs complement other types of explanations, such as feature attribution, by revealing the specific data transformations to which a machine learning model responds most strongly. In this paper, we argue that existing VCEs focus too narrowly on optimizing sample quality or change minimality; they fail to consider the more holistic desiderata for an explanation, such as fidelity, understandability, and sufficiency. To address this shortcoming, we explore new mechanisms for counterfactual generation and investigate how they can help fulfill these desiderata. We combine these mechanisms into a novel ‘smooth counterfactual explorer’ (SCE) algorithm and demonstrate its effectiveness through systematic evaluations on synthetic and real data.
arxiv情報
| 著者 | Sidney Bender,Jan Herrmann,Klaus-Robert Müller,Grégoire Montavon | 
| 発行日 | 2025-06-17 16:38:15+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
