cs.AR」カテゴリーアーカイブ

Revealing CNN Architectures via Side-Channel Analysis in Dataflow-based Inference Accelerators

要約 畳み込みニューラル ネットワーク (CNN) は、さまざまなドメインで広く … 続きを読む

カテゴリー: cs.AR, cs.CR, cs.LG | Revealing CNN Architectures via Side-Channel Analysis in Dataflow-based Inference Accelerators はコメントを受け付けていません

CuRobo: Parallelized Collision-Free Minimum-Jerk Robot Motion Generation

要約 この論文では、マニピュレータの衝突のないモーション生成の問題を、グローバル … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.RO | CuRobo: Parallelized Collision-Free Minimum-Jerk Robot Motion Generation はコメントを受け付けていません

Learning Independent Program and Architecture Representations for Generalizable Performance Modeling

要約 この論文では、高次元の独立/直交プログラムとマイクロアーキテクチャ表現を学 … 続きを読む

カテゴリー: cs.AR, cs.LG | Learning Independent Program and Architecture Representations for Generalizable Performance Modeling はコメントを受け付けていません

LLM-FP4: 4-Bit Floating-Point Quantized Transformers

要約 私たちは、トレーニング後の方法で、大規模言語モデル (LLM) の重みとア … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CL, cs.CV | LLM-FP4: 4-Bit Floating-Point Quantized Transformers はコメントを受け付けていません

KirchhoffNet: A Circuit Bridging Message Passing and Continuous-Depth Models

要約 この論文では、アナログ電子回路の基本原理であるキルヒホッフの電流法則を利用 … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG | KirchhoffNet: A Circuit Bridging Message Passing and Continuous-Depth Models はコメントを受け付けていません

MAD Max Beyond Single-Node: Enabling Large Machine Learning Model Acceleration on Distributed Systems

要約 大規模な機械学習 (ML) モデルのトレーニングとデプロイには時間がかかり … 続きを読む

カテゴリー: cs.AR, cs.DC, cs.LG | MAD Max Beyond Single-Node: Enabling Large Machine Learning Model Acceleration on Distributed Systems はコメントを受け付けていません

Towards the Imagenets of ML4EDA

要約 RTL から GDSII まで、ML ガイド付き EDA ツールへの関心が … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG, cs.PL | Towards the Imagenets of ML4EDA はコメントを受け付けていません

Quantized Transformer Language Model Implementations on Edge Devices

要約 BiDirectional Encoder Representations … 続きを読む

カテゴリー: cs.AR, cs.CL | Quantized Transformer Language Model Implementations on Edge Devices はコメントを受け付けていません

NeuralMatrix: Compute the Entire Neural Networks with Linear Matrix Operations for Efficient Inference

要約 個々のディープ ニューラル ネットワーク (DNN) モデル内の計算タイプ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.LG | NeuralMatrix: Compute the Entire Neural Networks with Linear Matrix Operations for Efficient Inference はコメントを受け付けていません

Training and inference of large language models using 8-bit floating point

要約 FP8 形式は、大規模な深層学習モデルのトレーニングと推論の計算効率を高め … 続きを読む

カテゴリー: cs.AR, cs.CL, cs.ET, cs.LG, cs.PF, I.2.7 | Training and inference of large language models using 8-bit floating point はコメントを受け付けていません