cs.AR」カテゴリーアーカイブ

BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration

要約 大規模言語モデル (LLM) は、さまざまな機械学習タスクにわたって優れた … 続きを読む

カテゴリー: cs.AR, cs.LG | BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration はコメントを受け付けていません

Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems

要約 リソースを大量に消費するトランスフォーマーをエッジ デバイスに効率的に導入 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.AR, I.2.7 | Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems はコメントを受け付けていません

Exploring GPU-to-GPU Communication: Insights into Supercomputer Interconnects

要約 急速に進化するエクサスケール スーパーコンピューターの状況では、マルチ G … 続きを読む

カテゴリー: C.2.1, cs.AI, cs.AR, cs.DC, cs.NI, cs.PF | Exploring GPU-to-GPU Communication: Insights into Supercomputer Interconnects はコメントを受け付けていません

OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling

要約 ディープ ニューラル ネットワーク (DNN) は、計算量とデータ量が多い … 続きを読む

カテゴリー: cs.AI, cs.AR | OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling はコメントを受け付けていません

A System Level Performance Evaluation for Superconducting Digital Systems

要約 超電導デジタル (SCD) テクノロジーは、次世代の大規模コンピューティン … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.ET | A System Level Performance Evaluation for Superconducting Digital Systems はコメントを受け付けていません

ProactivePIM: Accelerating Weight-Sharing Embedding Layer with PIM for Scalable Recommendation System

要約 パーソナライズされたレコメンデーション システムの継続的なサイズ拡大により … 続きを読む

カテゴリー: cs.AI, cs.AR | ProactivePIM: Accelerating Weight-Sharing Embedding Layer with PIM for Scalable Recommendation System はコメントを受け付けていません

StoX-Net: Stochastic Processing of Partial Sums for Efficient In-Memory Computing DNN Accelerators

要約 クロスバーベースのインメモリ コンピューティング (IMC) は、ディープ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.ET | StoX-Net: Stochastic Processing of Partial Sums for Efficient In-Memory Computing DNN Accelerators はコメントを受け付けていません

Multi-Dimensional Reconfigurable, Physically Composable Hybrid Diffractive Optical Neural Network

要約 超並列高効率コンピューティングのために自由空間光波伝播を利用する回折光ニュ … 続きを読む

カテゴリー: cs.AI, cs.AR, physics.optics | Multi-Dimensional Reconfigurable, Physically Composable Hybrid Diffractive Optical Neural Network はコメントを受け付けていません

LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation

要約 有向非巡回グラフ (DAG) は、コンピューティング システムのハードウェ … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG | LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation はコメントを受け付けていません

Pushing the Performance Envelope of DNN-based Recommendation Systems Inference on GPUs

要約 パーソナライズされたレコメンデーションは、インターネット上のユビキタスなア … 続きを読む

カテゴリー: cs.AR, cs.DB, cs.IR, cs.LG, cs.PF, cs.SE | Pushing the Performance Envelope of DNN-based Recommendation Systems Inference on GPUs はコメントを受け付けていません