-
最近の投稿
- Aerial Path Online Planning for Urban Scene Updation
- GP-GS: Gaussian Processes for Enhanced Gaussian Splatting
- CHD: Coupled Hierarchical Diffusion for Long-Horizon Tasks
- FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images
- Rethinking Latent Redundancy in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation
-
最近のコメント
表示できるコメントはありません。 cs.AI (37971) cs.CL (28697) cs.CV (43567) cs.HC (2902) cs.LG (42896) cs.RO (22575) cs.SY (3461) eess.IV (5049) eess.SY (3453) stat.ML (5591)
「cs.PF」カテゴリーアーカイブ
MoE-Infinity: Offloading-Efficient MoE Model Serving
要約 このペーパーでは、疎な専門家混合 (MoE) モデル向けのオフロード効率の … 続きを読む
KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache
要約 大規模言語モデル (LLM) を効率的に処理するには、リクエストあたりのコ … 続きを読む
Mixture of Experts with Mixture of Precisions for Tuning Quality of Service
要約 リソースに制約のある環境で大規模な専門家混合 (MoE) モデルを展開する … 続きを読む
QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead
要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む
Characterizing and Understanding HGNN Training on GPUs
要約 ヘテロジニアス グラフ ニューラル ネットワーク (HGNN) は、異種グ … 続きを読む
Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture
要約 テンソル プロセッシング ユニット (TPU) は、データ センターや小規 … 続きを読む
Analytics of Longitudinal System Monitoring Data for Performance Prediction
要約 近年、いくつかの HPC 施設は、パフォーマンスと運用効率を理解するために … 続きを読む
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors
要約 サポート ベクター マシン (SVM) は、その高精度、高次元データの処理 … 続きを読む
Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments
要約 このホワイト ペーパーでは、Collective Mind フレームワーク … 続きを読む
Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems
要約 この論文では、確率ネットワーク、キューイング システム、統計力学のマルコフ … 続きを読む