要約
反事実の説明は、説明可能性に関して広く研究されており、公平性、求償権、およびモデルの理解において顕著なアプリケーション依存のさまざまな方法が使用されています。
ただし、これらのメソッドに関連する大きな欠点は、ローカル レベルまたはインスタンス レベルを超えた説明を提供できないことです。
多くの研究がグローバルな説明の概念に触れており、通常、グローバルな特性を確認することを期待してローカルな説明の塊を集約することを提案していますが、信頼性があり、計算的に扱いやすいフレームワークを提供しているものはほとんどありません。
一方、実務者は、より効率的でインタラクティブな説明ツールを求めています。
私たちはこの機会を利用して、現在の最先端技術、特に高次元のデータセットや連続特徴の存在下に関連する信頼性とスケーラビリティの問題に取り組む柔軟なフレームワークである Global & Efficient Counterfactual Explains (GLOBE-CE) を提案します。
。
さらに、カテゴリ特徴量の翻訳に関する独自の数学的分析を提供し、それをメソッドに利用します。
公開されているデータセットとユーザー調査による実験評価により、GLOBE-CE は複数の指標 (速度、信頼性など) において現在の最先端のものよりも大幅に優れたパフォーマンスを発揮することが実証されています。
要約(オリジナル)
Counterfactual explanations have been widely studied in explainability, with a range of application dependent methods prominent in fairness, recourse and model understanding. The major shortcoming associated with these methods, however, is their inability to provide explanations beyond the local or instance-level. While many works touch upon the notion of a global explanation, typically suggesting to aggregate masses of local explanations in the hope of ascertaining global properties, few provide frameworks that are both reliable and computationally tractable. Meanwhile, practitioners are requesting more efficient and interactive explainability tools. We take this opportunity to propose Global & Efficient Counterfactual Explanations (GLOBE-CE), a flexible framework that tackles the reliability and scalability issues associated with current state-of-the-art, particularly on higher dimensional datasets and in the presence of continuous features. Furthermore, we provide a unique mathematical analysis of categorical feature translations, utilising it in our method. Experimental evaluation with publicly available datasets and user studies demonstrate that GLOBE-CE performs significantly better than the current state-of-the-art across multiple metrics (e.g., speed, reliability).
arxiv情報
著者 | Dan Ley,Saumitra Mishra,Daniele Magazzeni |
発行日 | 2023-05-26 15:26:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google