TIGTEC : Token Importance Guided TExt Counterfactuals



– カウンターファクトとは、分類器の結果を反転させるインスタンスの変更によって予測を説明する例のことである。
– この論文は、テキストデータのための疎な、妥当な、多様なカウンターファクトの説明を生成するための効率的かつモジュール化された方法であるTIGTECを提案している。
– TIGTECは、局所特徴量の重要性を用いた高い寄与度を持つ単語をターゲットとし、テキスト編集ヒューリスティックを使用して修正する。
– 新しいアテンションベースの局所特徴量の重要性が提案されている。
– セマンティック距離を統合したコスト関数でカウンターファクト候補を生成し、解決空間をビームサーチのように効率的に探索する。
– 実験の結果、TIGTECの成功率、疎性、多様性、妥当性が示された。
– この方法は、モデル固有の方法またはモデルに対して設計された方法の両方で使用でき、説明を生成するために非常に便利である。


Counterfactual examples explain a prediction by highlighting changes of instance that flip the outcome of a classifier. This paper proposes TIGTEC, an efficient and modular method for generating sparse, plausible and diverse counterfactual explanations for textual data. TIGTEC is a text editing heuristic that targets and modifies words with high contribution using local feature importance. A new attention-based local feature importance is proposed. Counterfactual candidates are generated and assessed with a cost function integrating semantic distance, while the solution space is efficiently explored in a beam search fashion. The conducted experiments show the relevance of TIGTEC in terms of success rate, sparsity, diversity and plausibility. This method can be used in both model-specific or model-agnostic way, which makes it very convenient for generating counterfactual explanations.


著者 Milan Bhan,Jean-Noel Vittaut,Nicolas Chesneau,Marie-Jeanne Lesot
発行日 2023-04-24 20:11:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG, stat.ME パーマリンク