Hamming Similarity and Graph Laplacians for Class Partitioning and Adversarial Image Detection

要約

タイトル:Hamming Similarityとグラフ・ラプラシアンを用いたクラス分割と敵対的画像検出

要約:

– ニューラルネットワークの振る舞いを理解するために、ReLUのアクティベーションパターンをビットベクトルとしてエンコードし、研究することがある。
– Representational Dissimilarity Matrices(RDM)を使用して、深層ニューラルネットワークの埋め込み空間内のデータの一貫性を調べることができる。
– ネットワークの各層から、ビットベクトルを抽出して画像間の類似度スコアを構築し、2クラスの画像のコレクションのために類似度行列を構築する。
– その後、Fiedlerパーティショニングを適用してクラスを分離するために、関連するラプラシアン行列を使用する。
– ビットベクトル表現により、ネットワークはクラスの検出可能性を引き続き改善し、最後のReLU層で95%以上の分離精度を実現することが示されている。
– さらに、ビットベクトルは敵対的画像検出に役立ち、シンプルな分類器を使用して、敵対的および非敵対的画像を95%以上の精度で分離することが示されている。

要約(オリジナル)

Researchers typically investigate neural network representations by examining activation outputs for one or more layers of a network. Here, we investigate the potential for ReLU activation patterns (encoded as bit vectors) to aid in understanding and interpreting the behavior of neural networks. We utilize Representational Dissimilarity Matrices (RDMs) to investigate the coherence of data within the embedding spaces of a deep neural network. From each layer of a network, we extract and utilize bit vectors to construct similarity scores between images. From these similarity scores, we build a similarity matrix for a collection of images drawn from 2 classes. We then apply Fiedler partitioning to the associated Laplacian matrix to separate the classes. Our results indicate, through bit vector representations, that the network continues to refine class detectability with the last ReLU layer achieving better than 95\% separation accuracy. Additionally, we demonstrate that bit vectors aid in adversarial image detection, again achieving over 95\% accuracy in separating adversarial and non-adversarial images using a simple classifier.

arxiv情報

著者 Huma Jamil,Yajing Liu,Turgay Caglar,Christina Cole,Nathaniel Blanchard,Christopher Peterson,Michael Kirby
発行日 2023-05-02 22:16:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, math.OC パーマリンク