C.1」カテゴリーアーカイブ

RAGO: Systematic Performance Optimization for Retrieval-Augmented Generation Serving

要約 大規模な言語モデル(LLM)と外部知識データベースからの検索を組み合わせた … 続きを読む

カテゴリー: C.1, cs.AI, cs.CL, cs.DC, cs.IR | RAGO: Systematic Performance Optimization for Retrieval-Augmented Generation Serving はコメントを受け付けていません

A Survey on Hardware Accelerators for Large Language Models

要約 大規模言語モデル (LLM) は、自然言語処理タスク用の強力なツールとして … 続きを読む

カテゴリー: C.1, cs.AR, cs.CL, cs.LG | A Survey on Hardware Accelerators for Large Language Models はコメントを受け付けていません

Design Space Exploration of Approximate Computing Techniques with a Reinforcement Learning Approach

要約 近似コンピューティング (AxC) 技術は、さまざまなアプリケーションでパ … 続きを読む

カテゴリー: C.1, cs.AR, cs.LG, cs.PF | Design Space Exploration of Approximate Computing Techniques with a Reinforcement Learning Approach はコメントを受け付けていません