Posthoc Interpretation via Quantization

要約

この論文では、訓練された分類器によって行われた決定を解釈するための、「量子化による事後解釈 (PIQ)」と呼ばれる新しいアプローチを紹介します。
私たちの方法は、ベクトル量子化を利用して、分類子の表現を離散的なクラス固有の潜在空間に変換します。
クラス固有のコードブックはボトルネックとして機能し、インタプリタは、予測を行うために分類器によって関連すると見なされる入力データの部分に集中する必要があります。
定量的および定性的な研究を通じて私たちの方法を評価したところ、PIQ は、文献の他のいくつかの解釈方法と比較して、ユーザー調査への参加者がより簡単に理解できる解釈を生成することがわかりました。

要約(オリジナル)

In this paper, we introduce a new approach, called ‘Posthoc Interpretation via Quantization (PIQ)’, for interpreting decisions made by trained classifiers. Our method utilizes vector quantization to transform the representations of a classifier into a discrete, class-specific latent space. The class-specific codebooks act as a bottleneck that forces the interpreter to focus on the parts of the input data deemed relevant by the classifier for making a prediction. We evaluated our method through quantitative and qualitative studies and found that PIQ generates interpretations that are more easily understood by participants to our user studies when compared to several other interpretation methods in the literature.

arxiv情報

著者 Cem Subakan,Francesco Paissan,Mirco Ravanelli
発行日 2023-03-22 15:37:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS パーマリンク