A multi-criteria approach for selecting an explanation from the set of counterfactuals produced by an ensemble of explainers

要約

反事実は、より望ましい予測を得るための代替シナリオを提供することによって、MLモデルの予測を説明するために広く使用されている。それらは、異なる、時には相反する、品質尺度を最適化し、全く異なる解を生成する様々な手法によって生成することができる。しかしながら、最も適切な説明方法と生成された反事実の1つを選択することは、簡単な作業ではない。本論文では、ユーザーに多くの異なる説明方法をテストさせ、相反する解を分析させる代わりに、多基準分析に基づいて単一の反事実を選択する多段階アンサンブルアプローチを使用することを提案する。これは、複数の一般的な品質尺度で良いスコアを出す妥協解を提供する。このアプローチは、パレートフロントから1つの反事実を選択する支配関係と理想点決定支援法を利用する。実施した実験により、提案手法は、考慮した品質尺度の魅力的な妥協値を持つ、完全に実行可能な反事実を生成することが実証された。

要約(オリジナル)

Counterfactuals are widely used to explain ML model predictions by providing alternative scenarios for obtaining the more desired predictions. They can be generated by a variety of methods that optimize different, sometimes conflicting, quality measures and produce quite different solutions. However, choosing the most appropriate explanation method and one of the generated counterfactuals is not an easy task. Instead of forcing the user to test many different explanation methods and analysing conflicting solutions, in this paper, we propose to use a multi-stage ensemble approach that will select single counterfactual based on the multiple-criteria analysis. It offers a compromise solution that scores well on several popular quality measures. This approach exploits the dominance relation and the ideal point decision aid method, which selects one counterfactual from the Pareto front. The conducted experiments demonstrated that the proposed approach generates fully actionable counterfactuals with attractive compromise values of the considered quality measures.

arxiv情報

著者 Ignacy Stępka,Mateusz Lango,Jerzy Stefanowski
発行日 2024-08-02 15:54:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク