cs.PF」カテゴリーアーカイブ

KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache

要約 大規模言語モデル (LLM) を効率的に処理するには、リクエストあたりのコ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.PF | KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache はコメントを受け付けていません

Mixture of Experts with Mixture of Precisions for Tuning Quality of Service

要約 リソースに制約のある環境で大規模な専門家混合 (MoE) モデルを展開する … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.PF | Mixture of Experts with Mixture of Precisions for Tuning Quality of Service はコメントを受け付けていません

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead はコメントを受け付けていません

Characterizing and Understanding HGNN Training on GPUs

要約 ヘテロジニアス グラフ ニューラル ネットワーク (HGNN) は、異種グ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PF | Characterizing and Understanding HGNN Training on GPUs はコメントを受け付けていません

Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture

要約 テンソル プロセッシング ユニット (TPU) は、データ センターや小規 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG, cs.PF | Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture はコメントを受け付けていません

Analytics of Longitudinal System Monitoring Data for Performance Prediction

要約 近年、いくつかの HPC 施設は、パフォーマンスと運用効率を理解するために … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | Analytics of Longitudinal System Monitoring Data for Performance Prediction はコメントを受け付けていません

An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors

要約 サポート ベクター マシン (SVM) は、その高精度、高次元データの処理 … 続きを読む

カテゴリー: cs.LG, cs.PF | An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors はコメントを受け付けていません

Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments

要約 このホワイト ペーパーでは、Collective Mind フレームワーク … 続きを読む

カテゴリー: cs.ET, cs.LG, cs.PF | Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments はコメントを受け付けていません

Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems

要約 この論文では、確率ネットワーク、キューイング システム、統計力学のマルコフ … 続きを読む

カテゴリー: cs.LG, cs.PF, math.OC, math.PR | Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems はコメントを受け付けていません

It’s all about PR — Smart Benchmarking AI Accelerators using Performance Representatives

要約 統計モデルは、商用既製 (COTS) AI ハードウェア アクセラレータの … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PF | It’s all about PR — Smart Benchmarking AI Accelerators using Performance Representatives はコメントを受け付けていません