cs.PF」カテゴリーアーカイブ

Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture

要約 テンソル プロセッシング ユニット (TPU) は、データ センターや小規 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG, cs.PF | Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture はコメントを受け付けていません

Analytics of Longitudinal System Monitoring Data for Performance Prediction

要約 近年、いくつかの HPC 施設は、パフォーマンスと運用効率を理解するために … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | Analytics of Longitudinal System Monitoring Data for Performance Prediction はコメントを受け付けていません

An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors

要約 サポート ベクター マシン (SVM) は、その高精度、高次元データの処理 … 続きを読む

カテゴリー: cs.LG, cs.PF | An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors はコメントを受け付けていません

Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments

要約 このホワイト ペーパーでは、Collective Mind フレームワーク … 続きを読む

カテゴリー: cs.ET, cs.LG, cs.PF | Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments はコメントを受け付けていません

Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems

要約 この論文では、確率ネットワーク、キューイング システム、統計力学のマルコフ … 続きを読む

カテゴリー: cs.LG, cs.PF, math.OC, math.PR | Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems はコメントを受け付けていません

It’s all about PR — Smart Benchmarking AI Accelerators using Performance Representatives

要約 統計モデルは、商用既製 (COTS) AI ハードウェア アクセラレータの … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PF | It’s all about PR — Smart Benchmarking AI Accelerators using Performance Representatives はコメントを受け付けていません

ProTrain: Efficient LLM Training via Memory-Aware Techniques

要約 大規模言語モデル (LLM) をトレーニングするには、非常にメモリを消費し … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.PF | ProTrain: Efficient LLM Training via Memory-Aware Techniques はコメントを受け付けていません

Unveiling Energy Efficiency in Deep Learning: Measurement, Prediction, and Scoring across Edge Devices

要約 現在、ディープラーニングの最適化は主に、高い推論精度の達成とレイテンシの短 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NI, cs.PF, I.2.11 | Unveiling Energy Efficiency in Deep Learning: Measurement, Prediction, and Scoring across Edge Devices はコメントを受け付けていません

QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead

要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead はコメントを受け付けていません

Off-the-Shelf Neural Network Architectures for Forex Time Series Prediction come at a Cost

要約 私たちの研究は、さまざまな長期短期記憶 (LSTM) ニューラル ネットワ … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG, cs.PF | Off-the-Shelf Neural Network Architectures for Forex Time Series Prediction come at a Cost はコメントを受け付けていません