FPGA-based Acceleration of Neural Network for Image Classification using Vitis AI

要約

近年、畳み込みニューラル ネットワーク (CNN) がコンピューター ビジョンに広く採用されています。
CPU または GPU で実行される複雑な CNN アーキテクチャは、スループットが不十分であるか、消費電力が法外に高いかのいずれかです。
したがって、これらの制限を解決するには、計算ワークロードを高速化する専用のハードウェアが必要になります。
このペーパーでは、Xilinx Zynq UltraScale+ MPSoC ZCU104 FPGA 評価ボード上の Vitis-AI を使用して、CIFAR-10 データセットによる画像分類のための CNN を高速化します。
この作業により、CPU および GPU のベースラインと比較して 3.33 ~ 5.82 倍の高いスループットと 3.39 ~ 6.30 倍の高いエネルギー効率が達成されます。
これは、深度推定や 3D 再構築などの下流タスクのために 2D 特徴を抽出できる可能性を示しています。

要約(オリジナル)

In recent years, Convolutional Neural Networks (CNNs) have been widely adopted in computer vision. Complex CNN architecture running on CPU or GPU has either insufficient throughput or prohibitive power consumption. Hence, there is a need to have dedicated hardware to accelerate the computation workload to solve these limitations. In this paper, we accelerate a CNN for image classification with the CIFAR-10 dataset using Vitis-AI on Xilinx Zynq UltraScale+ MPSoC ZCU104 FPGA evaluation board. The work achieves 3.33-5.82x higher throughput and 3.39-6.30x higher energy efficiency than CPU and GPU baselines. It shows the potential to extract 2D features for downstream tasks, such as depth estimation and 3D reconstruction.

arxiv情報

著者 Zhengdong Li,Frederick Ziyang Hong,C. Patrick Yue
発行日 2024-12-30 14:26:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク