cs.AR」カテゴリーアーカイブ

SupeRBNN: Randomized Binary Neural Network Using Adiabatic Superconductor Josephson Devices

要約 断熱量子磁束パラメトロン (AQFP) は、非常に高いエネルギー効率を備え … 続きを読む

カテゴリー: cs.AR, cs.ET, cs.LG | SupeRBNN: Randomized Binary Neural Network Using Adiabatic Superconductor Josephson Devices はコメントを受け付けていません

GPT4AIGChip: Towards Next-Generation AI Accelerator Design Automation via Large Language Models

要約 人工知能 (AI) の驚くべき機能と複雑な性質により、特化した AI アク … 続きを読む

カテゴリー: cs.AR, cs.LG | GPT4AIGChip: Towards Next-Generation AI Accelerator Design Automation via Large Language Models はコメントを受け付けていません

A Blueprint for Precise and Fault-Tolerant Analog Neural Networks

要約 アナログ コンピューティングは、従来のデジタル アーキテクチャによってもた … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.ET | A Blueprint for Precise and Fault-Tolerant Analog Neural Networks はコメントを受け付けていません

Edge-MoE: Memory-Efficient Multi-Task Vision Transformer Architecture with Task-level Sparsity via Mixture-of-Experts

要約 コンピューター ビジョンの研究者は、ビジョン トランスフォーマー (ViT … 続きを読む

カテゴリー: cs.AR, cs.CV | Edge-MoE: Memory-Efficient Multi-Task Vision Transformer Architecture with Task-level Sparsity via Mixture-of-Experts はコメントを受け付けていません

DSLOT-NN: Digit-Serial Left-to-Right Neural Network Accelerator

要約 我々は、ディープ ニューラル ネットワーク (DNN) における畳み込み演 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.PF | DSLOT-NN: Digit-Serial Left-to-Right Neural Network Accelerator はコメントを受け付けていません

GraPhSyM: Graph Physical Synthesis Model

要約 この研究では、物理合成前の回路ネットリストから物理合成後の回路遅延と面積メ … 続きを読む

カテゴリー: cs.AR, cs.LG | GraPhSyM: Graph Physical Synthesis Model はコメントを受け付けていません

CPU frequency scheduling of real-time applications on embedded devices with temporal encoding-based deep reinforcement learning

要約 小型デバイスは、ソフトデッドラインで定期的な専用タスクを実行するために、I … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.OS, cs.SY, eess.SY | CPU frequency scheduling of real-time applications on embedded devices with temporal encoding-based deep reinforcement learning はコメントを受け付けていません

PolyLUT: Learning Piecewise Polynomials for Ultra-Low Latency FPGA LUT-based Inference

要約 フィールド プログラマブル ゲート アレイ (FPGA) は、深層学習推論 … 続きを読む

カテゴリー: cs.AR, cs.LG, stat.ML | PolyLUT: Learning Piecewise Polynomials for Ultra-Low Latency FPGA LUT-based Inference はコメントを受け付けていません

TpuGraphs: A Performance Prediction Dataset on Large Tensor Computational Graphs

要約 正確なハードウェア パフォーマンス モデルは、コードの最適化において重要な … 続きを読む

カテゴリー: cs.AR, cs.LG, cs.SI | TpuGraphs: A Performance Prediction Dataset on Large Tensor Computational Graphs はコメントを受け付けていません

A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance

要約 推論中に低精度アキュムレータを使用する場合のオーバーフローを回避するために … 続きを読む

カテゴリー: cs.AR, cs.CV, cs.LG | A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance はコメントを受け付けていません