Q-SENN: Quantized Self-Explaining Neural Networks


コンピューター ビジョンでの説明が望まれることがよくありますが、ほとんどのディープ ニューラル ネットワークは、忠実度が疑わしい顕著性マップしか提供できません。
Self-Explaining Neural Networks (SENN) は、忠実性、多様性、根拠を備えた解釈可能な概念を抽出し、意思決定のためにそれらを線形に結合します。
量子化自己説明型ニューラルネットワーク Q-SENN を提案します。
Q-SENN は、より複雑なデータセットに適用可能であり、解釈不可能なベースライン モデルの精度のほとんどまたはすべてを維持しながら、SENN の要望を満たすかそれを超えており、考慮されたすべての指標において以前の研究を上回っています。
Q-SENN は、あらゆるクラスと特徴間の関係を、任意の数の可能な関係ではなく、肯定的、否定的、または中立のいずれかとして記述し、より人間に優しいバイナリの特徴を強制します。
各クラスには平均して解釈可能な特徴が 5 つだけ割り当てられているため、Q-SENN は説得力のあるローカルおよびグローバルな解釈可能性を示します。


Explanations in Computer Vision are often desired, but most Deep Neural Networks can only provide saliency maps with questionable faithfulness. Self-Explaining Neural Networks (SENN) extract interpretable concepts with fidelity, diversity, and grounding to combine them linearly for decision-making. While they can explain what was recognized, initial realizations lack accuracy and general applicability. We propose the Quantized-Self-Explaining Neural Network Q-SENN. Q-SENN satisfies or exceeds the desiderata of SENN while being applicable to more complex datasets and maintaining most or all of the accuracy of an uninterpretable baseline model, out-performing previous work in all considered metrics. Q-SENN describes the relationship between every class and feature as either positive, negative or neutral instead of an arbitrary number of possible relations, enforcing more binary human-friendly features. Since every class is assigned just 5 interpretable features on average, Q-SENN shows convincing local and global interpretability. Additionally, we propose a feature alignment method, capable of aligning learned features with human language-based concepts without additional supervision. Thus, what is learned can be more easily verbalized. The code is published: https://github.com/ThomasNorr/Q-SENN


著者 Thomas Norrenbrock,Marco Rudolph,Bodo Rosenhahn
発行日 2023-12-21 13:39:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク