cs.AR」カテゴリーアーカイブ

OPMOS: Ordered Parallel Multi-Objective Shortest-Path

要約 多目的最短経路 (MOS) 問題は、多属性グラフ内の開始ノードから宛先ノー … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.DS, cs.PF | OPMOS: Ordered Parallel Multi-Objective Shortest-Path はコメントを受け付けていません

OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling

要約 ディープ ニューラル ネットワーク (DNN) は、計算量とデータ量が多い … 続きを読む

カテゴリー: cs.AI, cs.AR | OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling はコメントを受け付けていません

Transforming the Hybrid Cloud for Emerging AI Workloads

要約 このホワイトペーパーは、IIDAI研究所内のIBM ResearchとUI … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.ET, cs.MA | Transforming the Hybrid Cloud for Emerging AI Workloads はコメントを受け付けていません

Analysis of Hardware Synthesis Strategies for Machine Learning in Collider Trigger and Data Acquisition

要約 現在および将来の高エネルギー粒子衝突器の物理的可能性を最大限に活用するため … 続きを読む

カテゴリー: cs.AR, cs.LG, hep-ex, physics.ins-det | Analysis of Hardware Synthesis Strategies for Machine Learning in Collider Trigger and Data Acquisition はコメントを受け付けていません

BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration

要約 大規模言語モデル (LLM) は、さまざまな機械学習タスクにわたって優れた … 続きを読む

カテゴリー: cs.AR, cs.LG | BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration はコメントを受け付けていません

Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems

要約 リソースを大量に消費するトランスフォーマーをエッジ デバイスに効率的に導入 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.AR, I.2.7 | Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems はコメントを受け付けていません

Exploring GPU-to-GPU Communication: Insights into Supercomputer Interconnects

要約 急速に進化するエクサスケール スーパーコンピューターの状況では、マルチ G … 続きを読む

カテゴリー: C.2.1, cs.AI, cs.AR, cs.DC, cs.NI, cs.PF | Exploring GPU-to-GPU Communication: Insights into Supercomputer Interconnects はコメントを受け付けていません

OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling

要約 ディープ ニューラル ネットワーク (DNN) は、計算量とデータ量が多い … 続きを読む

カテゴリー: cs.AI, cs.AR | OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling はコメントを受け付けていません

A System Level Performance Evaluation for Superconducting Digital Systems

要約 超電導デジタル (SCD) テクノロジーは、次世代の大規模コンピューティン … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.ET | A System Level Performance Evaluation for Superconducting Digital Systems はコメントを受け付けていません

ProactivePIM: Accelerating Weight-Sharing Embedding Layer with PIM for Scalable Recommendation System

要約 パーソナライズされたレコメンデーション システムの継続的なサイズ拡大により … 続きを読む

カテゴリー: cs.AI, cs.AR | ProactivePIM: Accelerating Weight-Sharing Embedding Layer with PIM for Scalable Recommendation System はコメントを受け付けていません