要約
repvgg のようなアーキテクチャを持つ畳み込みニューラル ネットワークのハードウェア効率の高いアーキテクチャを提示します。
フロップまたはパラメーターは、コンピューティング能力やメモリ帯域幅などのハードウェアに影響されないネットワークの効率を評価するための従来のメトリックです。
したがって、ハードウェアの計算能力とメモリ帯域幅を効率的に使用するようにニューラル ネットワークを設計する方法は、重要な問題です。
この論文では、ハードウェアを意識したニューラルネットワークを設計する方法を提案します。
この方法に基づいて、高計算ハードウェア (GPU など) にやさしく、YOLOv6 オブジェクト検出フレームワークに適用される EfficientRep シリーズの畳み込みネットワークを設計しました。
YOLOv6 は、v1 および v2 バージョンで YOLOv6N/YOLOv6S/YOLOv6M/YOLOv6L モデルを公開しています。
要約(オリジナル)
We present a hardware-efficient architecture of convolutional neural network, which has a repvgg-like architecture. Flops or parameters are traditional metrics to evaluate the efficiency of networks which are not sensitive to hardware including computing ability and memory bandwidth. Thus, how to design a neural network to efficiently use the computing ability and memory bandwidth of hardware is a critical problem. This paper proposes a method how to design hardware-aware neural network. Based on this method, we designed EfficientRep series convolutional networks, which are high-computation hardware(e.g. GPU) friendly and applied in YOLOv6 object detection framework. YOLOv6 has published YOLOv6N/YOLOv6S/YOLOv6M/YOLOv6L models in v1 and v2 versions.
arxiv情報
| 著者 | Kaiheng Weng,Xiangxiang Chu,Xiaoming Xu,Junshi Huang,Xiaoming Wei |
| 発行日 | 2023-02-01 11:46:04+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google