Feature Embedding by Template Matching as a ResNet Block

要約

畳み込みブロックは局所特徴抽出器として機能し、ニューラル ネットワークの成功の鍵となります。
ローカル セマンティック特徴の埋め込みをかなり明示的にするために、最適に一致するカーネルに従った特徴選択として畳み込みブロックを再定式化します。
このようにして、バッチ正規化 (BN) とそれに続く修正線形単位 (ReLU) が arg-max オプティマイザーとして解釈されると、典型的な ResNet ブロックが実際にテンプレート マッチングを介してローカル特徴埋め込みを実行することを示します。
この観点に従って、ラベル情報を使用して意味的に意味のある局所特徴の埋め込みを明示的に強制する残差ブロックを調整します。
具体的には、対応する領域が一致するクラスに従って、各局所領域に特徴ベクトルを割り当てます。
私たちは、画像分類用のいくつかのアーキテクチャを備えた 3 つの一般的なベンチマーク データセットでメソッドを評価し、私たちのアプローチがベースライン アーキテクチャのパフォーマンスを大幅に向上させることを一貫して示しています。

要約(オリジナル)

Convolution blocks serve as local feature extractors and are the key to success of the neural networks. To make local semantic feature embedding rather explicit, we reformulate convolution blocks as feature selection according to the best matching kernel. In this manner, we show that typical ResNet blocks indeed perform local feature embedding via template matching once batch normalization (BN) followed by a rectified linear unit (ReLU) is interpreted as arg-max optimizer. Following this perspective, we tailor a residual block that explicitly forces semantically meaningful local feature embedding through using label information. Specifically, we assign a feature vector to each local region according to the classes that the corresponding region matches. We evaluate our method on three popular benchmark datasets with several architectures for image classification and consistently show that our approach substantially improves the performance of the baseline architectures.

arxiv情報

著者 Ada Gorgun,Yeti Z. Gurbuz,A. Aydin Alatan
発行日 2023-08-15 15:06:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク