OpenHLS: High-Level Synthesis for Low-Latency Deep Neural Networks for Experimental Science


高エネルギー物理学、材料科学、宇宙論など、多くの実験主導の科学分野では、高速データ レートの実験がデータ取得システムに厳しい制約を課します。
他のフィルタリング タスクで効果的なディープ ニューラル ネットワークは、設計と展開が難しいため、このようなデータ収集システムでは広く採用されていません。
ディープ ニューラル ネットワークの高レベル表現を低レベル表現に変換するための高レベル合成技術に基づく、独自の依存関係のないオープン ソースの軽量コンパイラ フレームワーク OpenHLS を提示し、センサーに近いデバイスへの展開に適しています。
さまざまなワークロードで OpenHLS を評価し、高エネルギー回折顕微鏡のコンテキストでブラッグ ピーク検出のためのディープ ニューラル ネットワークのケーススタディ実装を提示します。
OpenHLS がスループット 4.8 $\mu$s/サンプルのネットワークの実装を生成できることを示します。これは、既存の実装よりも約 4$\times$ 改善されています。


In many experiment-driven scientific domains, such as high-energy physics, material science, and cosmology, high data rate experiments impose hard constraints on data acquisition systems: collected data must either be indiscriminately stored for post-processing and analysis, thereby necessitating large storage capacity, or accurately filtered in real-time, thereby necessitating low-latency processing. Deep neural networks, effective in other filtering tasks, have not been widely employed in such data acquisition systems, due to design and deployment difficulties. We present an open source, lightweight, compiler framework, without any proprietary dependencies, OpenHLS, based on high-level synthesis techniques, for translating high-level representations of deep neural networks to low-level representations, suitable for deployment to near-sensor devices such as field-programmable gate arrays. We evaluate OpenHLS on various workloads and present a case-study implementation of a deep neural network for Bragg peak detection in the context of high-energy diffraction microscopy. We show OpenHLS is able to produce an implementation of the network with a throughput 4.8 $\mu$s/sample, which is approximately a 4$\times$ improvement over the existing implementation


著者 Maksim Levental,Arham Khan,Ryan Chard,Kazutomo Yoshi,Kyle Chard,Ian Foster
発行日 2023-02-15 16:51:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AR, cs.LG パーマリンク