cs.DC」カテゴリーアーカイブ

Confidential Computing on NVIDIA Hopper GPUs: A Performance Benchmark Study

要約 このレポートでは、大規模言語モデル (LLM) 推論タスクに対して NVI … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.PF | Confidential Computing on NVIDIA Hopper GPUs: A Performance Benchmark Study はコメントを受け付けていません

Heterogeneity-Aware Cooperative Federated Edge Learning with Adaptive Computation and Communication Compression

要約 クラウドベースのフェデレーテッド ラーニング (FL) の欠点を動機として … 続きを読む

カテゴリー: cs.DC, cs.LG | Heterogeneity-Aware Cooperative Federated Edge Learning with Adaptive Computation and Communication Compression はコメントを受け付けていません

LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation

要約 有向非巡回グラフ (DAG) は、コンピューティング システムのハードウェ … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG | LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation はコメントを受け付けていません

TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training

要約 大規模言語モデル (LLM) の開発は、最先端の自然言語処理アプリケーショ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training はコメントを受け付けていません

Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts

要約 エキスパート並列は、スパースにゲートされたMoE(Mixture-of-E … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts はコメントを受け付けていません

Efficient Federated Learning against Heterogeneous and Non-stationary Client Unavailability

要約 断続的なクライアント可用性への対処は、フェデレーテッド ラーニング アルゴ … 続きを読む

カテゴリー: cs.DC, cs.LG, math.OC | Efficient Federated Learning against Heterogeneous and Non-stationary Client Unavailability はコメントを受け付けていません

Novel Architecture for Distributed Travel Data Integration and Service Provision Using Microservices

要約 このペーパーでは、航空予約システムの柔軟性とパフォーマンスを強化することを … 続きを読む

カテゴリー: cs.CE, cs.CL, cs.DC | Novel Architecture for Distributed Travel Data Integration and Service Provision Using Microservices はコメントを受け付けていません

Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications

要約 浮動小数点の非結合性によって引き起こされる並列プログラムの実行ごとの変動は … 続きを読む

カテゴリー: cs.DC, cs.LG | Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications はコメントを受け付けていません

ProMoE: Fast MoE-based LLM Serving using Proactive Caching

要約 大規模な言語モデルの有望なアプリケーションは、多くの場合、エッジ デバイス … 続きを読む

カテゴリー: cs.AI, cs.DC | ProMoE: Fast MoE-based LLM Serving using Proactive Caching はコメントを受け付けていません

PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures

要約 グラフ ニューラル ネットワーク (GNN) は、グラフ構造データを分析す … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG, cs.PF | PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures はコメントを受け付けていません