On Formal Feature Attribution and Its Approximation

要約

近年、人工知能 (AI) アルゴリズムと機械学習 (ML) モデルが広く使用されています。
それらは多大な成功を収めましたが、ML モデルの脆弱性、その公平性、解釈可能性の欠如などの多くの重要な問題により、説明可能な人工知能 (XAI) と正式な ML モデル検証の積極的な開発の必要性が正当化されます。
XAI の 2 つの主要な作業には、機能選択方法が含まれます。
アンカー、および特徴帰属技術。
ライムとシャープ。
その期待にもかかわらず、既存の特徴選択および属性アプローチのほとんどは、説明の不健全性や分布外のサンプリングなど、さまざまな重大な問題の影響を受けやすくなっています。
XAI に対する最近の正式なアプローチ (FXAI) は、上記の代替として機能し、これらの問題はありませんが、他にもいくつかの制限があります。
たとえば、スケーラビリティの制限に加えて、正式なアプローチでは機能の帰属の問題に取り組むことができません。
さらに、形式的な説明は、形式的には適切であるにもかかわらず、通常は非常に膨大な量になるため、実際の状況での適用が妨げられます。
上記を動機として、この論文は、形式的説明列挙に基づく特徴属性の場合に形式的 XAI の装置を適用する方法を提案します。
形式的特徴帰属 (FFA) は、形式的および非形式的な両方の既存の方法よりも有利であると主張されています。
問題の実際的な複雑さを考慮して、この論文では、正確な FFA を近似するための効率的な手法を提案します。
最後に、特徴の重要性の観点だけでなく、相対的な順序の観点からも、既存の特徴属性アルゴリズムと比較した、提案された近似 FFA の有効性の実験的証拠を提供します。

要約(オリジナル)

Recent years have witnessed the widespread use of artificial intelligence (AI) algorithms and machine learning (ML) models. Despite their tremendous success, a number of vital problems like ML model brittleness, their fairness, and the lack of interpretability warrant the need for the active developments in explainable artificial intelligence (XAI) and formal ML model verification. The two major lines of work in XAI include feature selection methods, e.g. Anchors, and feature attribution techniques, e.g. LIME and SHAP. Despite their promise, most of the existing feature selection and attribution approaches are susceptible to a range of critical issues, including explanation unsoundness and out-of-distribution sampling. A recent formal approach to XAI (FXAI) although serving as an alternative to the above and free of these issues suffers from a few other limitations. For instance and besides the scalability limitation, the formal approach is unable to tackle the feature attribution problem. Additionally, a formal explanation despite being formally sound is typically quite large, which hampers its applicability in practical settings. Motivated by the above, this paper proposes a way to apply the apparatus of formal XAI to the case of feature attribution based on formal explanation enumeration. Formal feature attribution (FFA) is argued to be advantageous over the existing methods, both formal and non-formal. Given the practical complexity of the problem, the paper then proposes an efficient technique for approximating exact FFA. Finally, it offers experimental evidence of the effectiveness of the proposed approximate FFA in comparison to the existing feature attribution algorithms not only in terms of feature importance and but also in terms of their relative order.

arxiv情報

著者 Jinqiang Yu,Alexey Ignatiev,Peter J. Stuckey
発行日 2023-07-07 04:20:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.LO パーマリンク