Exploiting Text-Image Latent Spaces for the Description of Visual Concepts

要約

Concept Activation Vectors (CAV) は、人間に優しいコンセプトをモデルの内部特徴抽出プロセスにリンクすることで、ニューラル ネットワークの意思決定に関する洞察を提供します。
ただし、新しい CAV セットが発見された場合でも、それらを人間が理解できる説明に翻訳する必要があります。
画像ベースのニューラル ネットワークの場合、これは通常、CAV の最も関連性の高い画像を視覚化することによって行われますが、概念の決定は人間に任されます。
この研究では、各 CAV のテキストによる説明を提案することで、新しく発見された概念セットの解釈を支援するアプローチを導入します。
これは、CAV を表す最も関連性の高い画像をテキスト画像埋め込みにマッピングすることによって行われ、これらの関連画像の結合記述が計算されます。
私たちは、エンコードされた完全な画像の代わりに、最も関連性の高い受容野を利用することを提案します。
我々は、特定の CAV ラベルを使用した場合と使用しない場合の複数の実験でこのアプローチの機能を実証し、提案されたアプローチが CAV の正確な説明を提供し、概念解釈の課題を軽減することを示します。

要約(オリジナル)

Concept Activation Vectors (CAVs) offer insights into neural network decision-making by linking human friendly concepts to the model’s internal feature extraction process. However, when a new set of CAVs is discovered, they must still be translated into a human understandable description. For image-based neural networks, this is typically done by visualizing the most relevant images of a CAV, while the determination of the concept is left to humans. In this work, we introduce an approach to aid the interpretation of newly discovered concept sets by suggesting textual descriptions for each CAV. This is done by mapping the most relevant images representing a CAV into a text-image embedding where a joint description of these relevant images can be computed. We propose utilizing the most relevant receptive fields instead of full images encoded. We demonstrate the capabilities of this approach in multiple experiments with and without given CAV labels, showing that the proposed approach provides accurate descriptions for the CAVs and reduces the challenge of concept interpretation.

arxiv情報

著者 Laines Schmalwasser,Jakob Gawlikowski,Joachim Denzler,Julia Niebling
発行日 2024-10-23 12:51:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク