要約
この文書では、私たちの知る限り、音声制御デバイス向けの $\Delta$RNN 対応の細粒時間スパーシティ認識 KWS IC としては初めての DeltaKWS を紹介します。
65 nm のプロトタイプ チップは、性能、面積、および電力効率を向上させるための多くの技術を備えています。具体的には次のとおりです。 1) 抽出された隣接する特徴ベクトル間の時間的類似性を利用する、生物由来のデルタゲート リカレント ニューラル ネットワーク ($\Delta$RNN) 分類器
入力フレームとネットワークの隠れた状態を排除し、不必要な操作とメモリ アクセスを排除します。
2) 混合精度量子化、低コストのコンピューティング構造、およびチャネル選択を活用する IIR BPF ベースの FEx。
3) 24 kB 0.6 V、$V_\text{TH}$ に近い重量の SRAM で、ファウンドリが提供する SRAM よりも 6.6 倍低い読み取り電力を実現します。
チップ測定結果から、DeltaKWS は 65 nm CMOS プロセスでそれぞれ 90.5%/89.5% の 11/12 クラス GSCD 精度と 36 nJ/判定のエネルギー消費を達成していることがわかります。
87% の時間スパース性では、計算レイテンシとエネルギー/推論がそれぞれ 2.4 倍/3.4 倍削減されます。
IIR BPF ベースの FEx、$\Delta$RNN アクセラレータ、および 24 kB の Near-$V_\text{TH}$ SRAM ブロックは、0.084 mm$^{2}$、0.319 mm$^{2}$、および 0.381 mm$^{2}$ を占有します。
それぞれ mm$^{2}$ (合計 0.78 mm$^{2}$)。
要約(オリジナル)
This paper introduces DeltaKWS, to the best of our knowledge, the first $\Delta$RNN-enabled fine-grained temporal sparsity-aware KWS IC for voice-controlled devices. The 65 nm prototype chip features a number of techniques to enhance performance, area, and power efficiencies, specifically: 1) a bio-inspired delta-gated recurrent neural network ($\Delta$RNN) classifier leveraging temporal similarities between neighboring feature vectors extracted from input frames and network hidden states, eliminating unnecessary operations and memory accesses; 2) an IIR BPF-based FEx that leverages mixed-precision quantization, low-cost computing structure and channel selection; 3) a 24 kB 0.6 V near-$V_\text{TH}$ weight SRAM that achieves 6.6X lower read power than the foundry-provided SRAM. From chip measurement results, we show that the DeltaKWS achieves an 11/12-class GSCD accuracy of 90.5%/89.5% respectively and energy consumption of 36 nJ/decision in 65 nm CMOS process. At 87% temporal sparsity, computing latency and energy/inference are reduced by 2.4X/3.4X, respectively. The IIR BPF-based FEx, $\Delta$RNN accelerator, and 24 kB near-$V_\text{TH}$ SRAM blocks occupy 0.084 mm$^{2}$, 0.319 mm$^{2}$, and 0.381 mm$^{2}$ respectively (0.78 mm$^{2}$ in total).
arxiv情報
著者 | Qinyu Chen,Kwantae Kim,Chang Gao,Sheng Zhou,Taekwang Jang,Tobi Delbruck,Shih-Chii Liu |
発行日 | 2024-11-26 15:37:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google