cs.DC」カテゴリーアーカイブ

ProMoE: Fast MoE-based LLM Serving using Proactive Caching

要約 大規模な言語モデルの有望なアプリケーションは、多くの場合、エッジ デバイス … 続きを読む

カテゴリー: cs.AI, cs.DC | ProMoE: Fast MoE-based LLM Serving using Proactive Caching はコメントを受け付けていません

PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures

要約 グラフ ニューラル ネットワーク (GNN) は、グラフ構造データを分析す … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG, cs.PF | PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures はコメントを受け付けていません

DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents

要約 オンデバイス制御エージェント (特にモバイル デバイス上) は、モバイル … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.SY, eess.SY | DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents はコメントを受け付けていません

Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead

要約 低ランク適応 (LoRA) を使用して大規模言語モデル (LLM) を微調 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead はコメントを受け付けていません

Optimizing Edge Offloading Decisions for Object Detection

要約 機械学習とハードウェアの最近の進歩により、賞賛に値する精度でリアルタイムの … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.NI | Optimizing Edge Offloading Decisions for Object Detection はコメントを受け付けていません

POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference

要約 LLM 推論の各リクエストは、コンピューティング バウンドのプリフィルとメ … 続きを読む

カテゴリー: cs.DC, cs.LG | POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference はコメントを受け付けていません

I’ve Got 99 Problems But FLOPS Ain’t One

要約 ハイパースケーラーは、大規模なネットワーク導入の状況を支配していますが、直 … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG, cs.NI | I’ve Got 99 Problems But FLOPS Ain’t One はコメントを受け付けていません

A Bayesian Framework for Clustered Federated Learning

要約 フェデレーション ラーニング (FL) の主な課題の 1 つは、非独立かつ … 続きを読む

カテゴリー: cs.DC, cs.LG, stat.ML | A Bayesian Framework for Clustered Federated Learning はコメントを受け付けていません

Final Report for CHESS: Cloud, High-Performance Computing, and Edge for Science and Security

要約 理論と実験のサイクルを自動化するには、実験室の機器、エッジ センサー、複数 … 続きを読む

カテゴリー: C.2.4, cs.CV, cs.DC, cs.PF, cs.SY, eess.SY | Final Report for CHESS: Cloud, High-Performance Computing, and Edge for Science and Security はコメントを受け付けていません

Liger Kernel: Efficient Triton Kernels for LLM Training

要約 大規模言語モデル (LLM) を大規模に効率的にトレーニングすることは、増 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Liger Kernel: Efficient Triton Kernels for LLM Training はコメントを受け付けていません