
Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces

要約 ベンチマークと共同設計は、ML モデル、ML ソフトウェア、次世代ハードウ … 続きを読む

カテゴリー: cs.DC, cs.LG | Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces はコメントを受け付けていません

Does Federated Learning Really Need Backpropagation?

要約 フェデレーテッド ラーニング (FL) は、分散クライアントがローカル デ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.DC, cs.LG | Does Federated Learning Really Need Backpropagation? はコメントを受け付けていません

Unbiased Compression Saves Communication in Distributed Optimization: When and How Much?

要約 通信圧縮は分散最適化における一般的な手法で、圧縮された勾配とモデル パラメ … 続きを読む

カテゴリー: cs.DC, cs.LG, math.OC | Unbiased Compression Saves Communication in Distributed Optimization: When and How Much? はコメントを受け付けていません

Error Feedback Shines when Features are Rare

要約 貪欲なスパース化 $\left({\color{green}\sf Top … 続きを読む

カテゴリー: cs.DC, cs.LG, math.OC, stat.ML | Error Feedback Shines when Features are Rare はコメントを受け付けていません

Flover: A Temporal Fusion Framework for Efficient Autoregressive Model Parallel Inference

要約 急速に進化する深層学習の分野では、モデルがより複雑になり、さまざまなアプリ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.DC, cs.LG | Flover: A Temporal Fusion Framework for Efficient Autoregressive Model Parallel Inference はコメントを受け付けていません

A Generic Performance Model for Deep Learning in a Distributed Environment

要約 深層学習アプリケーションのパフォーマンス モデリングは、モデル フレームワ … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | A Generic Performance Model for Deep Learning in a Distributed Environment はコメントを受け付けていません

TransPimLib: A Library for Efficient Transcendental Functions on Processing-in-Memory Systems

要約 Processing-in-Memory (PIM) は、最新のコンピュー … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG, cs.MS | TransPimLib: A Library for Efficient Transcendental Functions on Processing-in-Memory Systems はコメントを受け付けていません

An Experimental Evaluation of Machine Learning Training on a Real Processing-in-Memory System

要約 機械学習 (ML) アルゴリズムのトレーニングは計算集約的なプロセスであり … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG | An Experimental Evaluation of Machine Learning Training on a Real Processing-in-Memory System はコメントを受け付けていません

Sharing Lifelong Reinforcement Learning Knowledge via Modulating Masks

要約 生涯学習エージェントは、生涯にわたって複数のタスクを順番に学習することを目 … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.MA | Sharing Lifelong Reinforcement Learning Knowledge via Modulating Masks はコメントを受け付けていません

MPI-rical: Data-Driven MPI Distributed Parallelism Assistance with Transformers

要約 共有および分散メモリ システムのシリアル コードのソース間自動並列化は、ハ … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | MPI-rical: Data-Driven MPI Distributed Parallelism Assistance with Transformers はコメントを受け付けていません