Interpretable Regional Descriptors: Hyperbox-Based Local Explanations

要約

タイトル:解釈可能な地域記述子:ハイパーボックスに基づくローカル説明

要約:

– IRDは、局所的な、モデル非依存の解釈を提供するための解釈可能な地域記述子です。
– IRDは、ハイパーボックスであり、観察の特徴値を変更しても予測に影響を与えないように、観測の特徴値を説明します。
– IRDは、’even if’ arguments(半正確な説明)のセットを提供し、予測に影響を与える特徴と、ポイントバイアスまたは信じられないことが存在するかどうかを示します。
– 具体的なユースケースでは、機械学習モデラーと決定を受ける人の両方にとって有益であることが示されています。
– IRDの検索を最適化問題として形式化し、IRDを計算するための統一されたフレームワークを導入します。
– 既存のハイパーボックス法をこの統一されたフレームワークに適合させる方法を示します。
– ベンチマーク研究では、いくつかの品質指標に基づいて方法を比較し、IRDを改善するための2つの戦略を特定しました。

要約(オリジナル)

This work introduces interpretable regional descriptors, or IRDs, for local, model-agnostic interpretations. IRDs are hyperboxes that describe how an observation’s feature values can be changed without affecting its prediction. They justify a prediction by providing a set of ‘even if’ arguments (semi-factual explanations), and they indicate which features affect a prediction and whether pointwise biases or implausibilities exist. A concrete use case shows that this is valuable for both machine learning modelers and persons subject to a decision. We formalize the search for IRDs as an optimization problem and introduce a unifying framework for computing IRDs that covers desiderata, initialization techniques, and a post-processing method. We show how existing hyperbox methods can be adapted to fit into this unified framework. A benchmark study compares the methods based on several quality measures and identifies two strategies to improve IRDs.

arxiv情報

著者 Susanne Dandl,Giuseppe Casalicchio,Bernd Bischl,Ludwig Bothmann
発行日 2023-05-04 12:26:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, stat.ML パーマリンク