HEANA: A Hybrid Time-Amplitude Analog Optical Accelerator with Flexible Dataflows for Energy-Efficient CNN Inference

要約

フォトニックマイクロリング共振器(MRR)を用いたアナログアクセラレータは、整数化されたCNNの推論を高速化するために提案されており、電子的なアクセラレータに比べてスループットとエネルギー効率が著しく高い。しかし、既存のアナログフォトニックアクセラレータは、(i)様々なクロストーク効果による波長並列性の深刻な阻害、(ii)重み定常データフロー以外の様々なデータフローをサポートする柔軟性の欠如、(iii)その場蓄積を実行する光検出器の能力を十分に活用できない、という3つの欠点に悩まされている。これらの欠点は総体的に、先行するアクセラレータの性能とエネルギー効率を妨げている。これらの欠点に対処するため、われわれはHEANAと呼ばれる新しいハイブリッド時間振幅アナログ光加速器を提案する。HEANAは、ハイブリッド時間振幅アナログ光マルチプライヤ(TAOM)を採用し、複数のデータフローをサポートするHEANAの柔軟性を高めている。TAOMをスペクトル的にヒットレス配置することにより、クロストーク効果を大幅に低減し、HEANAの波長並列性を高めている。さらに、HEANAでは、我々が発明したバランスドフォトチャージアキュムレータ(BPCA)を採用することで、バッファレスのその場での時間的蓄積を可能にし、HEANAでリダクションネットワークを使用する必要性をなくし、関連するレイテンシとエネルギーのオーバーヘッドから解放している。4つの最新のCNNの推論を評価した結果、HEANAは、先行研究の2つのMRRベースのアナログCNNアクセラレータと比較して、同じ面積の比較において、gmeanで、フレーム/秒(FPS)とFPS/W(エネルギー効率)で、それぞれ少なくとも66倍と84倍の改善を提供することが示されました。

要約(オリジナル)

Several photonic microring resonators (MRRs) based analog accelerators have been proposed to accelerate the inference of integer-quantized CNNs with remarkably higher throughput and energy efficiency compared to their electronic counterparts. However, the existing analog photonic accelerators suffer from three shortcomings: (i) severe hampering of wavelength parallelism due to various crosstalk effects, (ii) inflexibility of supporting various dataflows other than the weight-stationary dataflow, and (iii) failure in fully leveraging the ability of photodetectors to perform in-situ accumulations. These shortcomings collectively hamper the performance and energy efficiency of prior accelerators. To tackle these shortcomings, we present a novel Hybrid timE Amplitude aNalog optical Accelerator, called HEANA. HEANA employs hybrid time-amplitude analog optical multipliers (TAOMs) that increase the flexibility of HEANA to support multiple dataflows. A spectrally hitless arrangement of TAOMs significantly reduces the crosstalk effects, thereby increasing the wavelength parallelism in HEANA. Moreover, HEANA employs our invented balanced photo-charge accumulators (BPCAs) that enable buffer-less, in-situ, temporal accumulations to eliminate the need to use reduction networks in HEANA, relieving it from related latency and energy overheads. Our evaluation for the inference of four modern CNNs indicates that HEANA provides improvements of atleast 66x and 84x in frames-per-second (FPS) and FPS/W (energy-efficiency), respectively, for equal-area comparisons, on gmean over two MRR-based analog CNN accelerators from prior work.

arxiv情報

著者 Sairam Sri Vatsavai,Venkata Sai Praneeth Karempudi,Ishan Thakkar
発行日 2024-02-05 18:05:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.AR, cs.ET パーマリンク