DSLOT-NN: Digit-Serial Left-to-Right Neural Network Accelerator


我々は、ディープ ニューラル ネットワーク (DNN) における畳み込み演算の推論を高速化することを目的として、DSLOT-NN と呼ばれる Digit-Serial Left-tO-righT (DSLOT) 算術ベースの処理技術を提案します。
処理エンジンは、データを左から右に処理する低レイテンシの最上位桁優先 (MSDF) (オンラインとも呼ばれる) 乗算器と加算器で構成されており、数字パイプライン方式で後続の演算を実行できます。
オンライン オペレーターの精度は実行時に調整できるため、電力とエネルギーの節約のために精度が犠牲になる可能性がある状況で非常に役立ちます。
提案されたデザインはザイリンクス Virtex-7 FPGA に実装されており、さまざまなパフォーマンス メトリックに関して最先端のストライプと比較されています。
結果は、提案された設計が省電力を実現し、サイクル時間が短くなり、ワット当たりの OPS が約 50% 高いことを示しています。


We propose a Digit-Serial Left-tO-righT (DSLOT) arithmetic based processing technique called DSLOT-NN with aim to accelerate inference of the convolution operation in the deep neural networks (DNNs). The proposed work has the ability to assess and terminate the ineffective convolutions which results in massive power and energy savings. The processing engine is comprised of low-latency most-significant-digit-first (MSDF) (also called online) multipliers and adders that processes data from left-to-right, allowing the execution of subsequent operations in digit-pipelined manner. Use of online operators eliminates the need for the development of complex mechanism of identifying the negative activation, as the output with highest weight value is generated first, and the sign of the result can be identified as soon as first non-zero digit is generated. The precision of the online operators can be tuned at run-time, making them extremely useful in situations where accuracy can be compromised for power and energy savings. The proposed design has been implemented on Xilinx Virtex-7 FPGA and is compared with state-of-the-art Stripes on various performance metrics. The results show the proposed design presents power savings, has shorter cycle time, and approximately 50% higher OPS per watt.


著者 Muhammad Sohail Ibrahim,Muhammad Usman,Malik Zohaib Nisar,Jeong-A,Lee
発行日 2023-09-12 07:36:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.AR, cs.PF パーマリンク