cs.PF」カテゴリーアーカイブ

CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing

要約 大規模言語モデルは、様々なタスクにおいて目覚ましい成功を収めているが、推論 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | コメントする

QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving

要約 量子化は、大規模な言語モデル(LLM)推論を加速できます。 INT8の量子 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | コメントする

NSFlow: An End-to-End FPGA Framework with Scalable Dataflow Architecture for Neuro-Symbolic AI

要約 Neuro-Symbolic AI(NSAI)は、AIシステムの透明性、推 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PF | コメントする

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

要約 大規模な言語モデル(LLM)は、長いシーケンスと複雑な推論タスクの処理にお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.PF | LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention はコメントを受け付けていません

Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning

要約 MILS(Multimodal Iterative LLM Solver) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.PF | Zero-Shot, But at What Cost? Unveiling the Hidden Overhead of MILS’s LLM-CLIP Framework for Image Captioning はコメントを受け付けていません

The Transient Cost of Learning in Queueing Systems

要約 キューイングシステムは、通信ネットワーク、ヘルスケア、サービスシステムなど … 続きを読む

カテゴリー: cs.DS, cs.LG, cs.PF, math.PR | The Transient Cost of Learning in Queueing Systems はコメントを受け付けていません

Performance Modeling of Data Storage Systems using Generative Models

要約 システムの高精度モデリングは、産業データ解析の主要分野のひとつである。シス … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF | Performance Modeling of Data Storage Systems using Generative Models はコメントを受け付けていません

NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices

要約 Neural Radiance Fields(NeRF)は、3D再構成にお … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM, cs.PF | NeRFlex: Resource-aware Real-time High-quality Rendering of Complex Scenes on Mobile Devices はコメントを受け付けていません

A Hitchhiker’s Guide to Understanding Performances of Two-Class Classifiers

要約 分類器の性能を正しく理解することは、様々なシナリオにおいて不可欠である。し … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.PF | A Hitchhiker’s Guide to Understanding Performances of Two-Class Classifiers はコメントを受け付けていません

Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models

要約 状態空間モデル(SSM)は、一貫したメモリ使用量と高いパフォーマンスにより … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models はコメントを受け付けていません