-
最近の投稿
- Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation
- DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
- ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement
- VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step
- Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish
-
最近のコメント
表示できるコメントはありません。 cs.AI (36046) cs.CL (27270) cs.CR (2747) cs.CV (41892) cs.LG (41012) cs.RO (21267) cs.SY (3212) eess.IV (4914) eess.SY (3206) stat.ML (5374)
「cs.PF」カテゴリーアーカイブ
KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache
要約 大規模言語モデル (LLM) を効率的に処理するには、リクエストあたりのコ … 続きを読む
Mixture of Experts with Mixture of Precisions for Tuning Quality of Service
要約 リソースに制約のある環境で大規模な専門家混合 (MoE) モデルを展開する … 続きを読む
QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead
要約 LLM を提供するには、KV キャッシュ内の Key-Value (KV) … 続きを読む
Characterizing and Understanding HGNN Training on GPUs
要約 ヘテロジニアス グラフ ニューラル ネットワーク (HGNN) は、異種グ … 続きを読む
Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture
要約 テンソル プロセッシング ユニット (TPU) は、データ センターや小規 … 続きを読む
Analytics of Longitudinal System Monitoring Data for Performance Prediction
要約 近年、いくつかの HPC 施設は、パフォーマンスと運用効率を理解するために … 続きを読む
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors
要約 サポート ベクター マシン (SVM) は、その高精度、高次元データの処理 … 続きを読む
Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments
要約 このホワイト ペーパーでは、Collective Mind フレームワーク … 続きを読む
Score-Aware Policy-Gradient Methods and Performance Guarantees using Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks and Queueing Systems
要約 この論文では、確率ネットワーク、キューイング システム、統計力学のマルコフ … 続きを読む