Recipro-CAM: Gradient-free reciprocal class activation map

要約

畳み込みニューラル ネットワーク (CNN) は、コンピューター ビジョンのディープ ラーニング アーキテクチャとして最も人気が高く、著名なものの 1 つになっていますが、そのブラック ボックス機能により、内部予測プロセスが隠されています。
このため、AI の実践者は、説明可能な AI に光を当てて、モデルの動作の解釈可能性を提供してきました。
特に、クラス アクティベーション マップ (CAM) と Grad-CAM ベースの方法は有望な結果を示していますが、アーキテクチャ上の制限や勾配計算の負担があります。
これらを解決するために、勾配のない方法として Score-CAM が提案されていますが、CAM または Grad-CAM ベースの方法と比較してより多くの実行時間が必要です。
したがって、抽出された特徴マップを空間的にマスキングして活性化マップとネットワーク出力の間の相関関係を利用することにより、軽量アーキテクチャと勾配のない相互 CAM (Recipro-CAM) を提案します。
提案された方法により、VGG-16 (1:39% ドロップ
)。
さらに、Recipro-CAM は、Grad-CAM と同様の顕著性マップ生成速度を示し、Score-CAM よりも約 148 倍高速です。

要約(オリジナル)

Convolutional neural network (CNN) becomes one of the most popular and prominent deep learning architectures for computer vision, but its black box feature hides the internal prediction process. For this reason, AI practitioners have shed light on explainable AI to provide the interpretability of the model behavior. In particular, class activation map (CAM) and Grad-CAM based methods have shown promise results, but they have architectural limitation or gradient computing burden. To resolve these, Score-CAM has been suggested as a gradient-free method, however, it requires more execution time compared to CAM or Grad-CAM based methods. Therefore, we propose a lightweight architecture and gradient free Reciprocal CAM (Recipro-CAM) by spatially masking the extracted feature maps to exploit the correlation between activation maps and network outputs. With the proposed method, we achieved the gains of 1:78 – 3:72% in the ResNet family compared to Score-CAM in Average Drop- Coherence-Complexity (ADCC) metric, excluding the VGG-16 (1:39% drop). In addition, Recipro-CAM exhibits a saliency map generation rate similar to Grad-CAM and approximately 148 times faster than Score-CAM.

arxiv情報

著者 Seok-Yong Byun,Wonju Lee
発行日 2022-09-28 13:15:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク