cs.PF」カテゴリーアーカイブ

Canvas: End-to-End Kernel Architecture Search in Neural Networks

要約 タイトル:ニューラルネットワークにおけるエンドツーエンドのカーネルアーキテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.PF | Canvas: End-to-End Kernel Architecture Search in Neural Networks はコメントを受け付けていません

Energy Efficiency Considerations for Popular AI Benchmarks

要約 【タイトル】人気のAIベンチマークにおけるエネルギー効率性の考慮 【要約】 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF | Energy Efficiency Considerations for Popular AI Benchmarks はコメントを受け付けていません

TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings

要約 【タイトル】TPU v4: ハードウェア埋め込みサポート付きの機械学習のた … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PF | TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings はコメントを受け付けていません

ParaGraph: Weighted Graph Representation for Performance Optimization of HPC Kernels

要約 【タイトル】ParaGraph:HPCカーネルのパフォーマンス最適化のため … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | ParaGraph: Weighted Graph Representation for Performance Optimization of HPC Kernels はコメントを受け付けていません

Tensor Slicing and Optimization for Multicore NPUs

要約 タイトル:マルチコアNPU向けのテンソルスライシングと最適化 要約: &# … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.PF | Tensor Slicing and Optimization for Multicore NPUs はコメントを受け付けていません

DIPPM: a Deep Learning Inference Performance Predictive Model using Graph Neural Networks

要約 ディープ ラーニング (DL) は、私たちが現在依存している多くの日常的な … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG, cs.PF | DIPPM: a Deep Learning Inference Performance Predictive Model using Graph Neural Networks はコメントを受け付けていません

Dynamic Stashing Quantization for Efficient Transformer Training

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理 (NLP) タス … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.PF | Dynamic Stashing Quantization for Efficient Transformer Training はコメントを受け付けていません

Advancing Direct Convolution using Convolution Slicing Optimization and ISA Extensions

要約 畳み込みは、機械学習モデルの推論のために実行する必要がある、最も計算集約的 … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.LG, cs.PF | Advancing Direct Convolution using Convolution Slicing Optimization and ISA Extensions はコメントを受け付けていません

NL2CMD: An Updated Workflow for Natural Language to Bash Commands Translation

要約 自然言語をBashコマンドに翻訳することは、近年注目されている研究分野です … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.PF | NL2CMD: An Updated Workflow for Natural Language to Bash Commands Translation はコメントを受け付けていません

Power Constrained Autotuning using Graph Neural Networks

要約 マルチコアおよびメニーコア プロセッサの最近の進歩により、科学計算アプリケ … 続きを読む

カテゴリー: cs.DC, cs.LG, cs.PF | Power Constrained Autotuning using Graph Neural Networks はコメントを受け付けていません