TAME: Attention Mechanism Based Feature Fusion for Generating Explanation Maps of Convolutional Neural Networks

要約

ニューラル ネットワークの明らかな「ブラック ボックス」の性質は、説明可能性が不可欠なアプリケーションで採用する際の障壁となっています。
この論文では、TAME (Trainable Attention Mechanism for Explanations) を紹介します。これは、マルチブランチの階層的注意メカニズムを使用して説明マップを生成する方法です。
TAME は、アテンション メカニズムを使用して複数のレイヤーからターゲット モデルの機能マップを結合し、それらを説明マップに変換します。
TAME は、アテンション メカニズムのトレーニング方法の最適化とターゲット モデルの特徴マップの選択を合理化することにより、任意の畳み込みニューラル ネットワーク (CNN) に簡単に適用できます。
トレーニング後、説明マップは 1 回のフォワード パスで計算できます。
ImageNet でトレーニングされた 2 つの広く使用されているモデル、つまり VGG-16 と ResNet-50 に TAME を適用し、以前の最高性能の方法よりも改善されていることを示します。
また、TAME のアーキテクチャのさまざまなバリエーションのパフォーマンスを比較する包括的なアブレーション研究も提供します。
TAME のソース コードは、https://github.com/bmezaris/TAME で公開されています。

要約(オリジナル)

The apparent “black box” nature of neural networks is a barrier to adoption in applications where explainability is essential. This paper presents TAME (Trainable Attention Mechanism for Explanations), a method for generating explanation maps with a multi-branch hierarchical attention mechanism. TAME combines a target model’s feature maps from multiple layers using an attention mechanism, transforming them into an explanation map. TAME can easily be applied to any convolutional neural network (CNN) by streamlining the optimization of the attention mechanism’s training method and the selection of target model’s feature maps. After training, explanation maps can be computed in a single forward pass. We apply TAME to two widely used models, i.e. VGG-16 and ResNet-50, trained on ImageNet and show improvements over previous top-performing methods. We also provide a comprehensive ablation study comparing the performance of different variations of TAME’s architecture. TAME source code is made publicly available at https://github.com/bmezaris/TAME

arxiv情報

著者 Mariano Ntrougkas,Nikolaos Gkalelis,Vasileios Mezaris
発行日 2023-01-18 10:05:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク