CountARFactuals — Generating plausible model-agnostic counterfactual explanations with adversarial random forests

要約

反事実的説明とは、アルゴリズムによる意思決定を、別の望ましい結果を導くであろうシナリオを指し示すことによって解明するものである。モデルの振る舞いを洞察することで、ユーザーに可能な行動を示唆し、決定に異議を唱える根拠を与える。これらの目標を達成するための重要な要素として、反実仮想は、データ多様体内の現実的な代替シナリオを記述する、すなわち、もっともらしいものでなければならない。本稿では、最近開発された生成モデリング技術である敵対的ランダムフォレスト(ARF)を活用し、モデルに依存しない方法で、もっともらしい反事実を効率的に生成する。ARFは尤もらしさの尺度として、あるいは直接的に反事実の説明を生成することができる。我々のARFベースのアプローチは、もっともらしい反事実説明を生成することを目的とした既存の手法の限界を超える:訓練が容易で計算効率が高く、連続データやカテゴリーデータを自然に扱うことができ、スパース性のような付加的な望みを簡単に統合することができる。

要約(オリジナル)

Counterfactual explanations elucidate algorithmic decisions by pointing to scenarios that would have led to an alternative, desired outcome. Giving insight into the model’s behavior, they hint users towards possible actions and give grounds for contesting decisions. As a crucial factor in achieving these goals, counterfactuals must be plausible, i.e., describing realistic alternative scenarios within the data manifold. This paper leverages a recently developed generative modeling technique — adversarial random forests (ARFs) — to efficiently generate plausible counterfactuals in a model-agnostic way. ARFs can serve as a plausibility measure or directly generate counterfactual explanations. Our ARF-based approach surpasses the limitations of existing methods that aim to generate plausible counterfactual explanations: It is easy to train and computationally highly efficient, handles continuous and categorical data naturally, and allows integrating additional desiderata such as sparsity in a straightforward manner.

arxiv情報

著者 Susanne Dandl,Kristin Blesch,Timo Freiesleben,Gunnar König,Jan Kapar,Bernd Bischl,Marvin Wright
発行日 2024-04-04 15:10:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ML パーマリンク