Adapting to Change: Robust Counterfactual Explanations in Dynamic Data Landscapes

要約

我々は、新しい半教師付きグラフ反事実説明(GCE)手法である動的GRAph反事実説明(DyGRACE)を紹介する。DyGRACEは、データ分布に関する初期知識を活用し、有効な反事実を探索する。DyGRACEは2つのグラフオートエンコーダ(GAE)を用いて、二値分類シナリオにおける各クラスの表現を学習する。GAEは、学習中に元のグラフと学習された表現との間の再構成誤差を最小化する。この手法では、(i)パラメトリック密度関数(ロジスティック回帰関数として実装)を最適化し、事実オートエンコーダの再構成誤差を最大化し、(ii)反事実オートエンコーダの誤差を最小化し、(iii)事実グラフと反事実グラフの類似度を最大化することで、反事実を識別する。この半教師付きアプローチは、基礎となるブラックボックスオラクルに依存しない。ロジスティック回帰モデルは、反事実の発見を助ける重みを学習するために、グラフペアの集合で学習される。推論では、未見のグラフそれぞれについて、ロジスティック回帰モデルは学習された重みを用いて最良の反事実候補を特定する。DyGRACEは非常に効果的で、ドリフト検出器として機能し、反復間の再構成誤差の差に基づいて分布ドリフトを識別することができる。これにより、連続する反復におけるオラクルの予測への依存を回避し、反事実発見の効率を高めることができる。DyGRACEは、対照学習とドリフト検出の能力を備え、半教師付き学習と説明生成に新たな道を提供するだろう。

要約(オリジナル)

We introduce a novel semi-supervised Graph Counterfactual Explainer (GCE) methodology, Dynamic GRAph Counterfactual Explainer (DyGRACE). It leverages initial knowledge about the data distribution to search for valid counterfactuals while avoiding using information from potentially outdated decision functions in subsequent time steps. Employing two graph autoencoders (GAEs), DyGRACE learns the representation of each class in a binary classification scenario. The GAEs minimise the reconstruction error between the original graph and its learned representation during training. The method involves (i) optimising a parametric density function (implemented as a logistic regression function) to identify counterfactuals by maximising the factual autoencoder’s reconstruction error, (ii) minimising the counterfactual autoencoder’s error, and (iii) maximising the similarity between the factual and counterfactual graphs. This semi-supervised approach is independent of an underlying black-box oracle. A logistic regression model is trained on a set of graph pairs to learn weights that aid in finding counterfactuals. At inference, for each unseen graph, the logistic regressor identifies the best counterfactual candidate using these learned weights, while the GAEs can be iteratively updated to represent the continual adaptation of the learned graph representation over iterations. DyGRACE is quite effective and can act as a drift detector, identifying distributional drift based on differences in reconstruction errors between iterations. It avoids reliance on the oracle’s predictions in successive iterations, thereby increasing the efficiency of counterfactual discovery. DyGRACE, with its capacity for contrastive learning and drift detection, will offer new avenues for semi-supervised learning and explanation generation.

arxiv情報

著者 Bardh Prenkaj,Mario Villaizan-Vallelado,Tobias Leemann,Gjergji Kasneci
発行日 2023-08-04 14:41:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク