Counterfactual Explanation for Regression via Disentanglement in Latent Space


反事実的説明 (CE) は、ユーザーの観点からより好ましい結果を達成するために、予測モデルの予測に影響を与える要因をどのように変更できるかという質問に対処するのに役立ちます。
したがって、それらはわかりやすい説明を表すため、AI システムとのユーザーの対話をガイドする可能性を秘めています。
適用されるためには、CE は現実的で実行可能である必要があります。
文献では、CE を生成するさまざまな方法が提案されています。
この論文では、最初に潜在空間内のラベルに関連する次元とラベルに関連しない次元を解きほぐすことによって、事前に訓練されたリグレッサーの CE を生成する新しい方法を紹介します。
次に、ラベルに関係のないディメンションと事前定義された出力を組み合わせて CE が生成されます。
3 つの最先端の方法と比較して、元のデータ多様体に近い結果を効率的に返します。これは現実的な高次元機械学習アプリケーションに不可欠です。
私たちのコードは、この著作物の出版と同時にオープンソース パッケージとして利用可能になります。


Counterfactual Explanations (CEs) help address the question: How can the factors that influence the prediction of a predictive model be changed to achieve a more favorable outcome from a user’s perspective? Thus, they bear the potential to guide the user’s interaction with AI systems since they represent easy-to-understand explanations. To be applicable, CEs need to be realistic and actionable. In the literature, various methods have been proposed to generate CEs. However, the majority of research on CEs focuses on classification problems where questions like “What should I do to get my rejected loan approved?’ are raised. In practice, answering questions like “What should I do to increase my salary?’ are of a more regressive nature. In this paper, we introduce a novel method to generate CEs for a pre-trained regressor by first disentangling the label-relevant from the label-irrelevant dimensions in the latent space. CEs are then generated by combining the label-irrelevant dimensions and the predefined output. The intuition behind this approach is that the ideal counterfactual search should focus on the label-irrelevant characteristics of the input and suggest changes toward target-relevant characteristics. Searching in the latent space could help achieve this goal. We show that our method maintains the characteristics of the query sample during the counterfactual search. In various experiments, we demonstrate that the proposed method is competitive based on different quality measures on image and tabular datasets in regression problem settings. It efficiently returns results closer to the original data manifold compared to three state-of-the-art methods, which is essential for realistic high-dimensional machine learning applications. Our code will be made available as an open-source package upon the publication of this work.


著者 Xuan Zhao,Klaus Broelemann,Gjergji Kasneci
発行日 2023-11-14 15:08:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク