HEANA: A Hybrid Time-Amplitude Analog Optical Accelerator with Flexible Dataflows for Energy-Efficient CNN Inference


いくつかのフォトニックマイクロリング共振器 (MRR) ベースのアナログ加速器が、電子的な対応物と比較して著しく高いスループットとエネルギー効率で整数量子化 CNN の推論を加速するために提案されています。
しかし、既存のアナログ光加速器には 3 つの欠点があります。(i) さまざまなクロストーク効果による波長並列性の深刻な妨げ、(ii) 重み定常データフロー以外のさまざまなデータフローのサポートの柔軟性のなさ、(iii) 十分な活用ができない
これらの欠点に対処するために、HEANA と呼ばれる新しいハイブリッド時間振幅アナログ光加速器を紹介します。
HEANA は、HEANA の柔軟性を高めて複数のデータフローをサポートするハイブリッド時間振幅アナログ光乗算器 (TAOM) を採用しています。
スペクトル的にヒットレスな TAOM の配置により、クロストークの影響が大幅に低減され、それによって HEANA の波長並列性が向上します。
さらに、HEANA は当社が発明した平衡光電荷アキュムレータ (BPCA) を採用しており、バッファレスでその場での時間的蓄積を可能にし、HEANA でリダクション ネットワークを使用する必要性を排除し、関連するレイテンシとエネルギー オーバーヘッドから解放します。
4 つの最新の CNN の推論に対する評価では、HEANA が 2 の gmean で等面積比較の場合、フレーム/秒 (FPS) と FPS/W (エネルギー効率) でそれぞれ少なくとも 66 倍と 84 倍向上していることが示されています。
以前の研究からの MRR ベースのアナログ CNN アクセラレータ。


Several photonic microring resonators (MRRs) based analog accelerators have been proposed to accelerate the inference of integer-quantized CNNs with remarkably higher throughput and energy efficiency compared to their electronic counterparts. However, the existing analog photonic accelerators suffer from three shortcomings: (i) severe hampering of wavelength parallelism due to various crosstalk effects, (ii) inflexibility of supporting various dataflows other than the weight-stationary dataflow, and (iii) failure in fully leveraging the ability of photodetectors to perform in-situ accumulations. These shortcomings collectively hamper the performance and energy efficiency of prior accelerators. To tackle these shortcomings, we present a novel Hybrid timE Amplitude aNalog optical Accelerator, called HEANA. HEANA employs hybrid time-amplitude analog optical multipliers (TAOMs) that increase the flexibility of HEANA to support multiple dataflows. A spectrally hitless arrangement of TAOMs significantly reduces the crosstalk effects, thereby increasing the wavelength parallelism in HEANA. Moreover, HEANA employs our invented balanced photo-charge accumulators (BPCAs) that enable buffer-less, in-situ, temporal accumulations to eliminate the need to use reduction networks in HEANA, relieving it from related latency and energy overheads. Our evaluation for the inference of four modern CNNs indicates that HEANA provides improvements of atleast 66x and 84x in frames-per-second (FPS) and FPS/W (energy-efficiency), respectively, for equal-area comparisons, on gmean over two MRR-based analog CNN accelerators from prior work.


著者 Sairam Sri Vatsavai,Venkata Sai Praneeth Karempudi,Ishan Thakkar
発行日 2024-02-09 12:56:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.AR, cs.ET パーマリンク