A Survey on Hardware Accelerators for Large Language Models

要約

大規模言語モデル (LLM) は、自然言語処理タスク用の強力なツールとして登場し、人間のようなテキストを理解して生成する能力でこの分野に革命をもたらしました。
より高度な LLM への需要が高まるにつれ、その規模と複雑さに伴う計算上の課題に対処することが急務となっています。
このペーパーでは、大規模言語モデルのパフォーマンスとエネルギー効率を向上させるために設計されたハードウェア アクセラレータに関する包括的な調査を紹介します。
GPU、FPGA、カスタム設計アーキテクチャを含むさまざまなアクセラレータを調査することで、LLM の固有の計算需要を満たすように調整されたハードウェア ソリューションの状況を探ります。
この調査には、アーキテクチャ、パフォーマンス指標、エネルギー効率に関する考慮事項の詳細な分析が含まれており、実世界のアプリケーションでの LLM の展開の最適化を目指す研究者、エンジニア、意思決定者に貴重な洞察を提供します。

要約(オリジナル)

Large Language Models (LLMs) have emerged as powerful tools for natural language processing tasks, revolutionizing the field with their ability to understand and generate human-like text. As the demand for more sophisticated LLMs continues to grow, there is a pressing need to address the computational challenges associated with their scale and complexity. This paper presents a comprehensive survey on hardware accelerators designed to enhance the performance and energy efficiency of Large Language Models. By examining a diverse range of accelerators, including GPUs, FPGAs, and custom-designed architectures, we explore the landscape of hardware solutions tailored to meet the unique computational demands of LLMs. The survey encompasses an in-depth analysis of architecture, performance metrics, and energy efficiency considerations, providing valuable insights for researchers, engineers, and decision-makers aiming to optimize the deployment of LLMs in real-world applications.

arxiv情報

著者 Christoforos Kachris
発行日 2024-01-18 11:05:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: C.1, cs.AR, cs.CL, cs.LG パーマリンク