cs.DC」カテゴリーアーカイブ

POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference

要約 LLM 推論の各リクエストは、コンピューティング バウンドのプリフィルとメ … 続きを読む

カテゴリー: cs.DC, cs.LG | POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference はコメントを受け付けていません

I’ve Got 99 Problems But FLOPS Ain’t One

要約 ハイパースケーラーは、大規模なネットワーク導入の状況を支配していますが、直 … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG, cs.NI | I’ve Got 99 Problems But FLOPS Ain’t One はコメントを受け付けていません

A Bayesian Framework for Clustered Federated Learning

要約 フェデレーション ラーニング (FL) の主な課題の 1 つは、非独立かつ … 続きを読む

カテゴリー: cs.DC, cs.LG, stat.ML | A Bayesian Framework for Clustered Federated Learning はコメントを受け付けていません

Final Report for CHESS: Cloud, High-Performance Computing, and Edge for Science and Security

要約 理論と実験のサイクルを自動化するには、実験室の機器、エッジ センサー、複数 … 続きを読む

カテゴリー: C.2.4, cs.CV, cs.DC, cs.PF, cs.SY, eess.SY | Final Report for CHESS: Cloud, High-Performance Computing, and Edge for Science and Security はコメントを受け付けていません

Liger Kernel: Efficient Triton Kernels for LLM Training

要約 大規模言語モデル (LLM) を大規模に効率的にトレーニングすることは、増 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | Liger Kernel: Efficient Triton Kernels for LLM Training はコメントを受け付けていません

t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving

要約 自動運転車 (AV) によるマルチモーダル センサー (カメラ、ライダー、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, cs.RO | t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving はコメントを受け付けていません

SplitLLM: Collaborative Inference of LLMs for Model Placement and Throughput Optimization

要約 大規模言語モデル (LLM) は近年の破壊的イノベーションであり、人間のよ … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.NI | SplitLLM: Collaborative Inference of LLMs for Model Placement and Throughput Optimization はコメントを受け付けていません

cedar: Optimized and Unified Machine Learning Input Data Pipelines

要約 入力データ パイプラインは、各機械学習 (ML) トレーニング ジョブの重 … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | cedar: Optimized and Unified Machine Learning Input Data Pipelines はコメントを受け付けていません

FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression

要約 大規模なディープ ニューラル ネットワーク (DNN)、特に大規模言語モデ … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression はコメントを受け付けていません

HEnRY: A Multi-Agent System Framework for Multi-Domain Contexts

要約 HEnRY と名付けられたこのプロジェクトは、Intesa Sanpaol … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.MA | HEnRY: A Multi-Agent System Framework for Multi-Domain Contexts はコメントを受け付けていません