要約
コンピュータービジョン(CV)の分野での深層学習アルゴリズムの優れたパフォーマンスにより、畳み込みニューラルネットワーク(CNN)アーキテクチャーがコンピュータービジョンタスクの主要なバックボーンになりました。
モバイルデバイスの普及に伴い、計算能力の低いプラットフォームをベースにしたニューラルネットワークモデルが徐々に注目されています。
ただし、計算能力の制限により、ディープラーニングアルゴリズムは通常、モバイルデバイスでは利用できません。
この論文では、RaspberryPiで簡単に操作できる軽量の畳み込みニューラルネットワークTripleNetを提案します。
ThreshNetのブロック接続の概念を採用した、新しく提案されたネットワークモデルは、ネットワークモデルを圧縮および高速化し、ネットワークのパラメータの量を減らし、精度を確保しながら各画像の推論時間を短縮します。
提案されたTripleNetおよびその他の最先端(SOTA)ニューラルネットワークは、RaspberryPi上のCIFAR-10およびSVHNデータセットを使用して画像分類実験を実行します。
実験結果は、GhostNet、MobileNet、ThreshNet、EfficientNet、およびHarDNetと比較して、画像あたりのTripleNetの推論時間がそれぞれ15%、16%、17%、24%、および30%短縮されることを示しています。
要約(オリジナル)
With the good performance of deep learning algorithms in the field of computer vision (CV), the convolutional neural network (CNN) architecture has become a main backbone of the computer vision task. With the widespread use of mobile devices, neural network models based on platforms with low computing power are gradually being paid attention. However, due to the limitation of computing power, deep learning algorithms are usually not available on mobile devices. This paper proposes a lightweight convolutional neural network, TripleNet, which can operate easily on Raspberry Pi. Adopted from the concept of block connections in ThreshNet, the newly proposed network model compresses and accelerates the network model, reduces the amount of parameters of the network, and shortens the inference time of each image while ensuring the accuracy. Our proposed TripleNet and other state-of-the-art (SOTA) neural networks perform image classification experiments with the CIFAR-10 and SVHN datasets on Raspberry Pi. The experimental results show that, compared with GhostNet, MobileNet, ThreshNet, EfficientNet, and HarDNet, the inference time of TripleNet per image is shortened by 15%, 16%, 17%, 24%, and 30%, respectively.
arxiv情報
著者 | Rui-Yang Ju,Ting-Yu Lin,Jia-Hao Jian,Jen-Shiun Chiang |
発行日 | 2022-06-10 17:45:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google