FD-CAM: Improving Faithfulness and Discriminability of Visual Explanation for CNNs

要約

クラス活性化マップ(CAM)は、畳み込みニューラルネットワークの内部動作メカニズムを視覚的に説明するために広く研究されています。
既存のCAMベースの方法の鍵は、有効な重みを計算して、ターゲットの畳み込み層でアクティベーションマップを結合することです。
既存の勾配およびスコアベースの重み付けスキームは、CAMの識別可能性または忠実性のいずれかを保証する上で優位性を示していますが、通常、両方の特性で優れていることはありません。
この論文では、CAMベースのCNN視覚的説明の忠実性と識別可能性の両方を改善するために、FD-CAMという名前の新しいCAM重み付けスキームを提案します。
まず、グループ化されたチャネル切り替え操作を実行することにより、スコアベースの重みの忠実度と識別可能性を向上させます。
具体的には、チャネルごとに、類似性グループを計算し、チャネルのグループを同時にオンまたはオフに切り替えて、クラス予測スコアの変化を重みとして計算します。
次に、改善されたスコアベースの重みを従来の勾配ベースの重みと組み合わせて、最終的なCAMの識別可能性をさらに改善できるようにします。
最先端のCAMアルゴリズムとの広範な比較を実行します。
定量的および定性的な結果は、FD-CAMがCNNのより忠実でより識別力のある視覚的説明を生成できることを示しています。
また、結果を改善する上で提案されたグループ化されたチャネル切り替えと重みの組み合わせスキームの有効性を検証するための実験を実施します。
私たちのコードはhttps://github.com/crishhh1998/FD-CAMで入手できます。

要約(オリジナル)

Class activation map (CAM) has been widely studied for visual explanation of the internal working mechanism of convolutional neural networks. The key of existing CAM-based methods is to compute effective weights to combine activation maps in the target convolution layer. Existing gradient and score based weighting schemes have shown superiority in ensuring either the discriminability or faithfulness of the CAM, but they normally cannot excel in both properties. In this paper, we propose a novel CAM weighting scheme, named FD-CAM, to improve both the faithfulness and discriminability of the CAM-based CNN visual explanation. First, we improve the faithfulness and discriminability of the score-based weights by performing a grouped channel switching operation. Specifically, for each channel, we compute its similarity group and switch the group of channels on or off simultaneously to compute changes in the class prediction score as the weights. Then, we combine the improved score-based weights with the conventional gradient-based weights so that the discriminability of the final CAM can be further improved. We perform extensive comparisons with the state-of-the-art CAM algorithms. The quantitative and qualitative results show our FD-CAM can produce more faithful and more discriminative visual explanations of the CNNs. We also conduct experiments to verify the effectiveness of the proposed grouped channel switching and weight combination scheme on improving the results. Our code is available at https://github.com/crishhh1998/FD-CAM.

arxiv情報

著者 Hui Li,Zihao Li,Rui Ma,Tieru Wu
発行日 2022-06-17 14:08:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク