Towards Self-Explainability of Deep Neural Networks with Heatmap Captioning and Large-Language Models



– ヒートマップは深層学習モデルの解釈に広く用いられ、特にコンピュータビジョンにおいては注目されている
– しかしながら、これまでの研究では、生成されるヒートマップの品質向上や代替手法の発見が主であり、自動、インタラクティブ、拡張可能、アクセスしやすいヒートマップベースのXAI技術については研究が限られていた
– そのため、本論文では、コンテキストモデリングと推論の2つのモジュールから構成されるフレームワークを提案する
– コンテキストモデリングにはテンプレートベースの画像キャプショニング手法を用いて、ヒートマップと入力データからテキストベースのコンテキスト情報を作成する
– 推論モジュールでは、大規模言語モデルを利用して、専門知識を組み合わせた説明を提供する
– 実験の結果、提案フレームワーク及びヒートマップキャプショニング手法が効果的であることが示された
– テンプレートベースのヒートマップキャプショニング手法のコードは公に利用可能である。


Heatmaps are widely used to interpret deep neural networks, particularly for computer vision tasks, and the heatmap-based explainable AI (XAI) techniques are a well-researched topic. However, most studies concentrate on enhancing the quality of the generated heatmap or discovering alternate heatmap generation techniques, and little effort has been devoted to making heatmap-based XAI automatic, interactive, scalable, and accessible. To address this gap, we propose a framework that includes two modules: (1) context modelling and (2) reasoning. We proposed a template-based image captioning approach for context modelling to create text-based contextual information from the heatmap and input data. The reasoning module leverages a large language model to provide explanations in combination with specialised knowledge. Our qualitative experiments demonstrate the effectiveness of our framework and heatmap captioning approach. The code for the proposed template-based heatmap captioning approach will be publicly available.


著者 Osman Tursun,Simon Denman,Sridha Sridharan,Clinton Fookes
発行日 2023-04-05 03:29:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV, cs.HC, cs.LG パーマリンク