Performance/power assessment of CNN packages on embedded automotive platforms

要約

高並列アクセラレータをベースとした電力効率の高い組み込みコンピュータの台頭により、研究者やエンジニアに多くの機会と課題が開かれ、エッジ コンピューティングの時代への道が開かれました。
同時に、YOLO、GoogleNet、AlexNet などのオブジェクトの検出と分類のための組み込み AI の進歩により、前例のないレベルの精度 (平均精度 – mAP) とパフォーマンス (秒あたりのフレーム数 – FPS) に達しました。
現在、異種メニーコア システムに基づくエッジ コンピューターは、インダストリー 4.0、ウェアラブル デバイス、および当社が焦点を当てている自動運転システムにそのようなシステムを展開するための主な選択肢となっています。
後者のシステムでは、エンジニアは、自動車の出力とサイズの削減予算と、自動運転で要求される精度と性能の目標を両立させるのに苦労しています。
私たちは、NVIDIA および XCZU9EG 用の Xavier AGX、Tegra X2、Nano などの市販のシステムオンチップが組み込まれた最先端のプラットフォーム上で最新のネットワークの有効性と効率を検証することを目的としています。
Zynq UltraScale+ ファミリの XCZU3EG (ザイリンクス対応品)。
私たちの仕事は、エンジニアが設計に最適な CNN パッケージとコンピューティング システムを選択できるようにサポートし、システムの適切なサイジングのためのガイドラインを導き出すことを目的としています。

要約(オリジナル)

The rise of power-efficient embedded computers based on highly-parallel accelerators opens a number of opportunities and challenges for researchers and engineers, and paved the way to the era of edge computing. At the same time, advances in embedded AI for object detection and categorization such as YOLO, GoogleNet and AlexNet reached an unprecedented level of accuracy (mean-Average Precision – mAP) and performance (Frames-Per-Second – FPS). Today, edge computers based on heterogeneous many-core systems are a predominant choice to deploy such systems in industry 4.0, wearable devices, and – our focus – autonomous driving systems. In these latter systems, engineers struggle to make reduced automotive power and size budgets co-exist with the accuracy and performance targets requested by autonomous driving. We aim at validating the effectiveness and efficiency of most recent networks on state-of-the-art platforms with embedded commercial-off-the-shelf System-on-Chips, such as Xavier AGX, Tegra X2 and Nano for NVIDIA and XCZU9EG and XCZU3EG of the Zynq UltraScale+ family, for the Xilinx counterpart. Our work aims at supporting engineers in choosing the most appropriate CNN package and computing system for their designs, and deriving guidelines for adequately sizing their systems.

arxiv情報

著者 Paolo Burgio,Gianluca Brilli
発行日 2023-10-12 15:10:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC, cs.PF パーマリンク