Feature Embedding by Template Matching as a ResNet Block

要約

畳み込みブロックは局所的な特徴抽出器として機能し、ニューラルネットワークの成功の鍵となる。局所的な意味的特徴の埋め込みをより明確にするために、我々は畳み込みブロックをベストマッチング・カーネルに従った特徴選択として再定式化する。このように、バッチ正規化(BN)と整流線形ユニット(ReLU)をarg-max最適化器として解釈すると、典型的なResNetブロックはテンプレートマッチングによって実際に局所特徴埋め込みを行うことを示す。このような観点から、我々は、ラベル情報を用いて、意味的に意味のある局所特徴埋め込みを明示的に強制する残差ブロックを作成する。具体的には、各局所領域に対して、その領域がマッチするクラスに応じて特徴ベクトルを割り当てる。我々は、画像分類のためのいくつかのアーキテクチャを用いた3つの一般的なベンチマークデータセットで本手法を評価し、我々のアプローチがベースラインアーキテクチャの性能を大幅に向上させることを一貫して示した。

要約(オリジナル)

Convolution blocks serve as local feature extractors and are the key to success of the neural networks. To make local semantic feature embedding rather explicit, we reformulate convolution blocks as feature selection according to the best matching kernel. In this manner, we show that typical ResNet blocks indeed perform local feature embedding via template matching once batch normalization (BN) followed by a rectified linear unit (ReLU) is interpreted as arg-max optimizer. Following this perspective, we tailor a residual block that explicitly forces semantically meaningful local feature embedding through using label information. Specifically, we assign a feature vector to each local region according to the classes that the corresponding region matches. We evaluate our method on three popular benchmark datasets with several architectures for image classification and consistently show that our approach substantially improves the performance of the baseline architectures.

arxiv情報

著者 Ada Gorgun,Yeti Z. Gurbuz,A. Aydin Alatan
発行日 2022-10-03 14:58:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク