cs.DC」カテゴリーアーカイブ

StreamRL: Scalable, Heterogeneous, and Elastic RL for LLMs with Disaggregated Stream Generation

要約 強化学習(RL)は、大規模な言語モデル(LLMS)のコアポストトレーニング … 続きを読む

カテゴリー: cs.DC, cs.LG | StreamRL: Scalable, Heterogeneous, and Elastic RL for LLMs with Disaggregated Stream Generation はコメントを受け付けていません

Harmonia: A Multi-Agent Reinforcement Learning Approach to Data Placement and Migration in Hybrid Storage Systems

要約 ハイブリッドストレージシステム(HSS)は、複数のストレージデバイスを多様 … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG | Harmonia: A Multi-Agent Reinforcement Learning Approach to Data Placement and Migration in Hybrid Storage Systems はコメントを受け付けていません

Optimizing RLHF Training for Large Language Models with Stage Fusion

要約 人間のフィードバック(RLHF)からの補強学習のための段階的融合を備えた効 … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Optimizing RLHF Training for Large Language Models with Stage Fusion はコメントを受け付けていません

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

要約 大規模な言語モデル(LLM)は、長いシーケンスと複雑な推論タスクの処理にお … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.PF | LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention はコメントを受け付けていません

Exploring the Boundaries of On-Device Inference: When Tiny Falls Short, Go Hierarchical

要約 デバイス上の推論は、Edge MLシステムのエネルギー効率、応答性、プライ … 続きを読む

カテゴリー: cs.DC, cs.LG | Exploring the Boundaries of On-Device Inference: When Tiny Falls Short, Go Hierarchical はコメントを受け付けていません

Communication Optimization for Decentralized Learning atop Bandwidth-limited Edge Networks

要約 分散化されたフェデレーションラーニング(DFL)は、ネットワークエッジに人 … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.NI | Communication Optimization for Decentralized Learning atop Bandwidth-limited Edge Networks はコメントを受け付けていません

Understanding and Optimizing Multi-Stage AI Inference Pipelines

要約 大規模な言語モデル(LLMS)の急速な進化により、ますます洗練された推論パ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG | Understanding and Optimizing Multi-Stage AI Inference Pipelines はコメントを受け付けていません

Transforming Future Data Center Operations and Management via Physical AI

要約 ミッションクリティカルなインフラストラクチャとしてのデータセンター(DCS … 続きを読む

カテゴリー: cs.AI, cs.DC | Transforming Future Data Center Operations and Management via Physical AI はコメントを受け付けていません

Optimizing LLM Inference: Fluid-Guided Online Scheduling with Memory Constraints

要約 大規模な言語モデル(LLM)は今日のアプリケーションでは不可欠ですが、それ … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, math.OC, stat.ML | Optimizing LLM Inference: Fluid-Guided Online Scheduling with Memory Constraints はコメントを受け付けていません

Transformer-Based Model for Cold Start Mitigation in FaaS Architecture

要約 サーバーレスアーキテクチャ、特にサービス(FAAS)モデルとしての機能は、 … 続きを読む

カテゴリー: cs.AI, cs.DC | Transformer-Based Model for Cold Start Mitigation in FaaS Architecture はコメントを受け付けていません