EnforceSNN: Enabling Resilient and Energy-Efficient Spiking Neural Network Inference considering Approximate DRAMs for Embedded Systems

要約

タイトル:EnforceSNN:近似DRAMを考慮した埋め込みシステム向けの抵抗力があるエネルギー効率の高いスパイキングニューラルネットワーク推論を実現する

要約:
– SNN(スパイキングニューラルネットワーク)は、バイオプラウシブルな計算により高い精度と低い動作電力/エネルギーを達成する可能性があることが示されています。
– 以前の研究では、DRAMベースのオフチップメモリアクセスがSNN処理のエネルギー消費を支配していることが特定されました。
– 現在の状態においては、DRAMのエネルギーあたりのアクセスを最適化することができておらず、SNNベースのシステムがさらなるエネルギー効率の向上を達成するのを妨げています。
– DRAMの供給電圧を低下させることでDRAMのエネルギーあたりのアクセスを大幅に減らすことができますが、DRAMセルでエラーが発生する可能性があります。
– この問題に対処するため、低電圧DRAMを使用した抵抗力があるエネルギー効率の高いSNN推論のための新しい設計フレームワークであるEnforceSNNを提案します。
– EnforceSNNの主要なメカニズムは、量子化された重みを使用してDRAMへのアクセスエネルギーを削減すること、効率的なDRAMマッピングポリシーを策定してDRAMのエネルギーあたりのアクセスを最小化すること、SNNのエラートレランスを分析して異なるビットエラーレート(BER)値を考慮した正確さプロファイルを理解すること、BER値とDRAMのビットエラー位置を考慮した効率的な欠陥認識トレーニング(FAT)を開発すること、および精度、メモリ、エネルギー消費のトレードオフを提供するSNNモデルを選択するアルゴリズムを開発することです。
– 実験結果は、EnforceSNNがベースラインSNNと比較して、正確度(BERが10^-3以下では正確度の損失なし)を維持したままDRAMのエネルギー消費を最大84.9%削減し、異なるネットワークサイズにおいてDRAMのデータスループットを最大4.1倍高速化することを示しています。

要約(オリジナル)

Spiking Neural Networks (SNNs) have shown capabilities of achieving high accuracy under unsupervised settings and low operational power/energy due to their bio-plausible computations. Previous studies identified that DRAM-based off-chip memory accesses dominate the energy consumption of SNN processing. However, state-of-the-art works do not optimize the DRAM energy-per-access, thereby hindering the SNN-based systems from achieving further energy efficiency gains. To substantially reduce the DRAM energy-per-access, an effective solution is to decrease the DRAM supply voltage, but it may lead to errors in DRAM cells (i.e., so-called approximate DRAM). Towards this, we propose \textit{EnforceSNN}, a novel design framework that provides a solution for resilient and energy-efficient SNN inference using reduced-voltage DRAM for embedded systems. The key mechanisms of our EnforceSNN are: (1) employing quantized weights to reduce the DRAM access energy; (2) devising an efficient DRAM mapping policy to minimize the DRAM energy-per-access; (3) analyzing the SNN error tolerance to understand its accuracy profile considering different bit error rate (BER) values; (4) leveraging the information for developing an efficient fault-aware training (FAT) that considers different BER values and bit error locations in DRAM to improve the SNN error tolerance; and (5) developing an algorithm to select the SNN model that offers good trade-offs among accuracy, memory, and energy consumption. The experimental results show that our EnforceSNN maintains the accuracy (i.e., no accuracy loss for BER less-or-equal 10^-3) as compared to the baseline SNN with accurate DRAM, while achieving up to 84.9\% of DRAM energy saving and up to 4.1x speed-up of DRAM data throughput across different network sizes.

arxiv情報

著者 Rachmad Vidya Wicaksana Putra,Muhammad Abdullah Hanif,Muhammad Shafique
発行日 2023-04-08 15:15:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.AR, cs.LG, cs.NE パーマリンク