Decoupling Pixel Flipping and Occlusion Strategy for Consistent XAI Benchmarks

要約

特徴除去は、オクルージョンベースの説明 (Shapley 値) とその評価 (ピクセル フリッピング、PF) の両方において、eXplainable AI (XAI) の中心的な構成要素です。
ただし、オクルージョン戦略は、単純な平均置換から最先端の拡散モデルによる修復まで、大きく異なる場合があります。
この曖昧さにより、オクルージョンベースのアプローチの有用性が制限されます。
たとえば、PF ベンチマークでは矛盾したランキングが発生します。
これは、競合する PF 測定によって増幅されます。特徴は、最も影響力のあるものから順に削除される (MIF) か、影響力が最も小さいものから順に (LIF) から削除されます。
この研究は、この不一致の問題を解決するために 2 つの補完的な視点を提案します。
まず、人工サンプルは信頼性の低いモデル評価につながるという、オクルージョンベースの XAI に対する一般的な批判に対処します。
信頼性を R(reference)-Out-of-Model-Scope (OMS) スコアによって測定することを提案します。
R-OMS スコアにより、オクルージョン戦略の体系的な比較が可能になり、一貫した PF ランキングをグループ化することで不一致の問題が解決されます。
第二に、MIF と LIF の洞察力は逆に R-OMS スコアに依存することを示します。
これを活用するために、MIF 測定と LIF 測定を組み合わせて対称関連性ゲイン (SRG) 測定を作成します。
これにより、基礎となるオクルージョン戦略との固有の関係が壊れ、一貫したランキングが得られます。
これにより、不一致の問題が解決され、40 の異なるオクルージョン戦略のセットについて検証されました。

要約(オリジナル)

Feature removal is a central building block for eXplainable AI (XAI), both for occlusion-based explanations (Shapley values) as well as their evaluation (pixel flipping, PF). However, occlusion strategies can vary significantly from simple mean replacement up to inpainting with state-of-the-art diffusion models. This ambiguity limits the usefulness of occlusion-based approaches. For example, PF benchmarks lead to contradicting rankings. This is amplified by competing PF measures: Features are either removed starting with most influential first (MIF) or least influential first (LIF). This study proposes two complementary perspectives to resolve this disagreement problem. Firstly, we address the common criticism of occlusion-based XAI, that artificial samples lead to unreliable model evaluations. We propose to measure the reliability by the R(eference)-Out-of-Model-Scope (OMS) score. The R-OMS score enables a systematic comparison of occlusion strategies and resolves the disagreement problem by grouping consistent PF rankings. Secondly, we show that the insightfulness of MIF and LIF is conversely dependent on the R-OMS score. To leverage this, we combine the MIF and LIF measures into the symmetric relevance gain (SRG) measure. This breaks the inherent connection to the underlying occlusion strategy and leads to consistent rankings. This resolves the disagreement problem, which we verify for a set of 40 different occlusion strategies.

arxiv情報

著者 Stefan Blücher,Johanna Vielhaben,Nils Strodthoff
発行日 2024-01-12 16:01:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク