Progressive Meta-Pooling Learning for Lightweight Image Classification Model

要約

エッジ デバイスの実用的なネットワークでは、深さが浅く小さな畳み込みカーネルを採用して、メモリと計算コストを節約します。これにより、受容野が制限されます。
従来の効率的な学習方法は、ニューラル ネットワークの設計における受容野の役割を無視して、軽量の畳み込み設計に焦点を当てています。
この論文では、パラメータ化されたプーリングベースの操作で構成される軽量ネットワークの受容野を学習可能にするメタプーリングフレームワークを提案します。
具体的には、軽量モデルの各レイヤーに多用途の受容野を提供するためのプーリング操作で構成される、パラメーター化された空間エンハンサーを導入します。
次に、パラメーター化された空間エンハンサーが適切な受容野サイズを取得するためのプログレッシブ メタ プーリング学習 (PMPL) 戦略を提示します。
ImageNet データセットの結果は、Meta-Pooling を使用した MobileNetV2 が 74.6\% のトップ 1 精度を達成し、MobileNetV2 を 2.3\% 上回っていることを示しています。

要約(オリジナル)

Practical networks for edge devices adopt shallow depth and small convolutional kernels to save memory and computational cost, which leads to a restricted receptive field. Conventional efficient learning methods focus on lightweight convolution designs, ignoring the role of the receptive field in neural network design. In this paper, we propose the Meta-Pooling framework to make the receptive field learnable for a lightweight network, which consists of parameterized pooling-based operations. Specifically, we introduce a parameterized spatial enhancer, which is composed of pooling operations to provide versatile receptive fields for each layer of a lightweight model. Then, we present a Progressive Meta-Pooling Learning (PMPL) strategy for the parameterized spatial enhancer to acquire a suitable receptive field size. The results on the ImageNet dataset demonstrate that MobileNetV2 using Meta-Pooling achieves top1 accuracy of 74.6\%, which outperforms MobileNetV2 by 2.3\%.

arxiv情報

著者 Peijie Dong,Xin Niu,Zhiliang Tian,Lujun Li,Xiaodong Wang,Zimian Wei,Hengyue Pan,Dongsheng Li
発行日 2023-01-24 14:28:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク