Overview of Class Activation Maps for Visualization Explainability


深層学習方法論の最近の研究により、人間のパフォーマンスに達する、あるいは人間のパフォーマンスを上回る、コンピューター ビジョン (CV) におけるさまざまな複雑なモデリング技術が開発されました。
したがって、コンピュータ ビジョン (XCV) のための説明可能な技術の開発は、最近ますます注目を集めています。
XCV の領域では、クラス アクティベーション マップ (CAM) が広く認識され、ディープ ラーニング モデルの意思決定プロセスの解釈可能性と洞察を強化するために利用されています。
この研究では、クラス アクティベーション マップ手法の時間の経過に伴う進化の包括的な概要を示します。
また、CAM の評価に使用されるメトリックについても検討し、これらの方法の顕著性を向上させるための補助手法を紹介します。


Recent research in deep learning methodology has led to a variety of complex modelling techniques in computer vision (CV) that reach or even outperform human performance. Although these black-box deep learning models have obtained astounding results, they are limited in their interpretability and transparency which are critical to take learning machines to the next step to include them in sensitive decision-support systems involving human supervision. Hence, the development of explainable techniques for computer vision (XCV) has recently attracted increasing attention. In the realm of XCV, Class Activation Maps (CAMs) have become widely recognized and utilized for enhancing interpretability and insights into the decision-making process of deep learning models. This work presents a comprehensive overview of the evolution of Class Activation Map methods over time. It also explores the metrics used for evaluating CAMs and introduces auxiliary techniques to improve the saliency of these methods. The overview concludes by proposing potential avenues for future research in this evolving field.


著者 Anh Pham Thi Minh
発行日 2023-09-25 17:20:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, I.2.10 パーマリンク