cs.DC」カテゴリーアーカイブ

PipeInfer: Accelerating LLM Inference using Asynchronous Pipelined Speculation

要約 最近では、コンピューター クラスター全体にわたる大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | PipeInfer: Accelerating LLM Inference using Asynchronous Pipelined Speculation はコメントを受け付けていません

Personalized Conversational Travel Assistant powered by Generative AI

要約 Tourism and Destination Management Or … 続きを読む

カテゴリー: cs.AI, cs.DC | Personalized Conversational Travel Assistant powered by Generative AI はコメントを受け付けていません

Sparse Training for Federated Learning with Regularized Error Correction

要約 Federated Learning (FL) は、ディープ ニューラル … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | Sparse Training for Federated Learning with Regularized Error Correction はコメントを受け付けていません

Enhancing Split Computing and Early Exit Applications through Predefined Sparsity

要約 過去 10 年間で、ディープ ニューラル ネットワーク (DNN) は、物 … 続きを読む

カテゴリー: cs.CV, cs.DC, cs.LG | Enhancing Split Computing and Early Exit Applications through Predefined Sparsity はコメントを受け付けていません

Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression

要約 DLRM は、さまざまな業界アプリケーションで広く採用されている最先端のレ … 続きを読む

カテゴリー: cs.DC, cs.LG | Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression はコメントを受け付けていません

Cloud Atlas: Efficient Fault Localization for Cloud Systems using Language Models and Causal Insight

要約 実行時の障害やパフォーマンスの低下は、最新のクラウド システムではよくある … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | Cloud Atlas: Efficient Fault Localization for Cloud Systems using Language Models and Causal Insight はコメントを受け付けていません

Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture

要約 テンソル プロセッシング ユニット (TPU) は、データ センターや小規 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG, cs.PF | Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture はコメントを受け付けていません

OpenDiLoCo: An Open-Source Framework for Globally Distributed Low-Communication Training

要約 OpenDiLoCo は、大規模言語モデル用の分散低通信 (DiLoCo) … 続きを読む

カテゴリー: cs.DC, cs.LG | OpenDiLoCo: An Open-Source Framework for Globally Distributed Low-Communication Training はコメントを受け付けていません

Fine-Tuning Large Language Models with User-Level Differential Privacy

要約 私たちは、各ユーザーが投稿したすべてのサンプルを確実に保護するために、ユー … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.DC, cs.LG | Fine-Tuning Large Language Models with User-Level Differential Privacy はコメントを受け付けていません

Metron: Holistic Performance Evaluation Framework for LLM Inference Systems

要約 実稼働環境で大規模言語モデル (LLM) を提供すると、多額のコストが発生 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Metron: Holistic Performance Evaluation Framework for LLM Inference Systems はコメントを受け付けていません