Empowering CAM-based Methods with Capability to Generate Fine-Grained and High-Faithfulness Explanations

要約

最近、ニューラル ネットワーク モデルの説明が研究で大きな注目を集めています。
コンピュータ ビジョンでは、CAM (Class Activation Map) ベースの手法と LRP (Layer-wise Relevance Propagation) 手法が一般的な説明手法です。
ただし、ほとんどの CAM ベースの手法はグローバルな重みしか生成できないため、深い層では粗粒度の説明しか生成できません。
一方、LRP とその亜種は、詳細な説明を生成できます。
しかし、説明の忠実度は低すぎます。
これらの課題に対処するために、本稿では、CAM ベースの手法を拡張して、きめ細かく忠実度の高い説明を生成できる FG-CAM (Fine-Grained CAM) を提案します。
FG-CAM は、解像度差のある特徴マップの 2 つの隣接するレイヤー間の関係を使用して、寄与するピクセルを見つけて寄与しないピクセルをフィルタリングしながら、説明の解像度を徐々に高めます。
私たちの手法は、CAM ベースの手法の特性を変えることなくその欠点を解決するだけでなく、LRP やその亜種よりも忠実度の高いきめ細かい説明を生成します。
また、ノイズ除去を備えた FG-CAM も紹介します。これは FG-CAM の変形であり、説明の忠実度をほとんど変えることなく、ノイズの少ない説明を生成できます。
実験結果は、FG-CAM のパフォーマンスが説明解像度にほとんど影響を受けないことを示しています。
FG-CAM は、浅層と中間層の両方で既存の CAM ベースの手法を大幅に上回り、入力層では LRP とそのバリエーションを大幅に上回ります。
私たちのコードは https://github.com/dongmo-qcq/FG-CAM で入手できます。

要約(オリジナル)

Recently, the explanation of neural network models has garnered considerable research attention. In computer vision, CAM (Class Activation Map)-based methods and LRP (Layer-wise Relevance Propagation) method are two common explanation methods. However, since most CAM-based methods can only generate global weights, they can only generate coarse-grained explanations at a deep layer. LRP and its variants, on the other hand, can generate fine-grained explanations. But the faithfulness of the explanations is too low. To address these challenges, in this paper, we propose FG-CAM (Fine-Grained CAM), which extends CAM-based methods to enable generating fine-grained and high-faithfulness explanations. FG-CAM uses the relationship between two adjacent layers of feature maps with resolution differences to gradually increase the explanation resolution, while finding the contributing pixels and filtering out the pixels that do not contribute. Our method not only solves the shortcoming of CAM-based methods without changing their characteristics, but also generates fine-grained explanations that have higher faithfulness than LRP and its variants. We also present FG-CAM with denoising, which is a variant of FG-CAM and is able to generate less noisy explanations with almost no change in explanation faithfulness. Experimental results show that the performance of FG-CAM is almost unaffected by the explanation resolution. FG-CAM outperforms existing CAM-based methods significantly in both shallow and intermediate layers, and outperforms LRP and its variations significantly in the input layer. Our code is available at https://github.com/dongmo-qcq/FG-CAM.

arxiv情報

著者 Changqing Qiu,Fusheng Jin,Yining Zhang
発行日 2024-01-10 16:30:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク