要約
【タイトル】欠損値のある状態でカウンターファクチュアル説明を行う方法
【要約】
– CE(Counterfactual Explanation)とは、分類器の予測結果を変更するための摂動を提供する事後説明方法である。
– 一般的なCEの方法は、入力インスタンスの特徴量に完全な情報が必要であるが、実際の状況では欠損値が発生することがあるため、これらの方法は不適切である。
– 本論文では、欠損値の補完方法が行動の妥当性や変更を提案する特徴に影響を与えるリスクがあることを理論的・実証的に示した。
– さらに、本論文ではCEPIA(Counterfactual Explanation by Pairs of Imputation and Action)という新しいCEのフレームワークを提案し、欠損値のある状態でも妥当な行動を取得できるようにする。
– CEPIAは、与えられた不完全インスタンスの補間候補と最適な行動のペアの代表的なセットを提供する。この問題は、サブモジュラ最大化問題として定式化され、近似保証を持つ単純な貪欲アルゴリズムで解決できる。
– 実験結果は、欠損値がある場合において、CEPIAがベースラインと比較して効果的であることを示している。
要約(オリジナル)
Counterfactual Explanation (CE) is a post-hoc explanation method that provides a perturbation for altering the prediction result of a classifier. Users can interpret the perturbation as an ‘action’ to obtain their desired decision results. Existing CE methods require complete information on the features of an input instance. However, we often encounter missing values in a given instance, and the previous methods do not work in such a practical situation. In this paper, we first empirically and theoretically show the risk that missing value imputation methods affect the validity of an action, as well as the features that the action suggests changing. Then, we propose a new framework of CE, named Counterfactual Explanation by Pairs of Imputation and Action (CEPIA), that enables users to obtain valid actions even with missing values and clarifies how actions are affected by imputation of the missing values. Specifically, our CEPIA provides a representative set of pairs of an imputation candidate for a given incomplete instance and its optimal action. We formulate the problem of finding such a set as a submodular maximization problem, which can be solved by a simple greedy algorithm with an approximation guarantee. Experimental results demonstrated the efficacy of our CEPIA in comparison with the baselines in the presence of missing values.
arxiv情報
著者 | Kentaro Kanamori,Takuya Takagi,Ken Kobayashi,Yuichi Ike |
発行日 | 2023-04-28 03:22:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI