-
最近の投稿
- Uniform Mean Estimation for Heavy-Tailed Distributions via Median-of-Means
- No-Regret Learning Under Adversarial Resource Constraints: A Spending Plan Is All You Need!
- Probabilistic Aggregation and Targeted Embedding Optimization for Collective Moral Reasoning in Large Language Models
- AIn’t Nothing But a Survey? Using Large Language Models for Coding German Open-Ended Survey Responses on Survey Motivation
- Accurate and scalable exchange-correlation with deep learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (39817) cs.CL (30138) cs.CV (45123) cs.HC (3045) cs.LG (44746) cs.RO (23829) cs.SY (3627) eess.IV (5166) eess.SY (3619) stat.ML (5823)
「cs.PF」カテゴリーアーカイブ
Assessing Tenstorrent’s RISC-V MatMul Acceleration Capabilities
要約 大規模な言語モデル(LLMS)サービスとしての生成AIの需要の増加により、 … 続きを読む
CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing
要約 大規模言語モデルは、様々なタスクにおいて目覚ましい成功を収めているが、推論 … 続きを読む
QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving
要約 量子化は、大規模な言語モデル(LLM)推論を加速できます。 INT8の量子 … 続きを読む
NSFlow: An End-to-End FPGA Framework with Scalable Dataflow Architecture for Neuro-Symbolic AI
要約 Neuro-Symbolic AI(NSAI)は、AIシステムの透明性、推 … 続きを読む
LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention
要約 大規模な言語モデル(LLM)は、長いシーケンスと複雑な推論タスクの処理にお … 続きを読む
Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning
要約 MILS(Multimodal Iterative LLM Solver) … 続きを読む
The Transient Cost of Learning in Queueing Systems
要約 キューイングシステムは、通信ネットワーク、ヘルスケア、サービスシステムなど … 続きを読む
Performance Modeling of Data Storage Systems using Generative Models
要約 システムの高精度モデリングは、産業データ解析の主要分野のひとつである。シス … 続きを読む
NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices
要約 Neural Radiance Fields(NeRF)は、3D再構成にお … 続きを読む
A Hitchhiker’s Guide to Understanding Performances of Two-Class Classifiers
要約 分類器の性能を正しく理解することは、様々なシナリオにおいて不可欠である。し … 続きを読む