-
最近の投稿
- Computing High-dimensional Confidence Sets for Arbitrary Distributions
- Reservoir Computing: A New Paradigm for Neural Networks
- A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model
- Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators
-
最近のコメント
表示できるコメントはありません。 cs.AI (36107) cs.CL (27319) cs.CR (2749) cs.CV (41949) cs.LG (41080) cs.RO (21304) cs.SY (3219) eess.IV (4921) eess.SY (3213) stat.ML (5380)
「cs.PF」カテゴリーアーカイブ
It’s all about PR — Smart Benchmarking AI Accelerators using Performance Representatives
要約 統計モデルは、商用既製 (COTS) AI ハードウェア アクセラレータの … 続きを読む
ProTrain: Efficient LLM Training via Memory-Aware Techniques
要約 大規模言語モデル (LLM) をトレーニングするには、非常にメモリを消費し … 続きを読む
Unveiling Energy Efficiency in Deep Learning: Measurement, Prediction, and Scoring across Edge Devices
要約 現在、ディープラーニングの最適化は主に、高い推論精度の達成とレイテンシの短 … 続きを読む
QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead
要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む
Off-the-Shelf Neural Network Architectures for Forex Time Series Prediction come at a Cost
要約 私たちの研究は、さまざまな長期短期記憶 (LSTM) ニューラル ネットワ … 続きを読む
LFED: A Literary Fiction Evaluation Dataset for Large Language Models
要約 大規模言語モデル (LLM) の急速な進化により、さまざまな側面にわたって … 続きを読む
Stochastic Q-learning for Large Discrete Action Spaces
要約 大規模な離散アクション空間を持つ複雑な環境では、強化学習 (RL) におい … 続きを読む
A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs
要約 大量の通信、特に集団操作は、10 億パラメータのニューラル ネットワークの … 続きを読む
QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving
要約 量子化により、大規模言語モデル (LLM) 推論を高速化できます。 研究コ … 続きを読む