要約
タイトル:NPS: グラフニューラルネットワークを使用した正確なプログラムサンプリングのためのフレームワーク
要約:
– モーアの法則の終焉により、RISC-Vカスタム拡張など、現代のプロセッサで迅速なアーキテクチャの革新が求められています。
– マイクロプロセッサ設計において、プログラムサンプリングはワークロードシミュレーションのための代表的なシミュレーションポイントを選択する重要なステップです。
– SimPointは数十年間のデファクトアプローチであり、基本ブロックベクトル(BBV)の限られた表現力は、手作業による時間がかかる調整が必要であり、迅速なイノベーションやアジャイルハードウェア開発を妨げています。
– この論文は、動的なスナップショットを使用して実行の埋め込みを学習する新しいフレームワークであるNeural Program Sampling(NPS)を紹介します。
– NPSは、AssemblyNetを使用して埋め込み生成を展開します。AssemblyNetは、コード構造とランタイム状態を活用して、プログラムの振る舞いを、データ計算、コードパス、データフローなどの観点で捕捉するグラフモデルおよびニューラルアーキテクチャとして機能します。
– AssemblyNetは、連続したメモリアドレスを予測するデータプリフェッチタスクでトレーニングされます。
– 実験では、NPSはSimPointよりも最大63%優れており、平均エラーを38%低減しています。
– さらに、NPSは高い正確性を持つ強力な頑健性を示し、高価な正確性調整のオーバーヘッドを低減します。
– さらに、NPSは、コードの振る舞い学習において最先端のGNNアプローチよりも高い正確性と汎用性を示し、高品質の実行埋め込みの生成を可能にします。
要約(オリジナル)
With the end of Moore’s Law, there is a growing demand for rapid architectural innovations in modern processors, such as RISC-V custom extensions, to continue performance scaling. Program sampling is a crucial step in microprocessor design, as it selects representative simulation points for workload simulation. While SimPoint has been the de-facto approach for decades, its limited expressiveness with Basic Block Vector (BBV) requires time-consuming human tuning, often taking months, which impedes fast innovation and agile hardware development. This paper introduces Neural Program Sampling (NPS), a novel framework that learns execution embeddings using dynamic snapshots of a Graph Neural Network. NPS deploys AssemblyNet for embedding generation, leveraging an application’s code structures and runtime states. AssemblyNet serves as NPS’s graph model and neural architecture, capturing a program’s behavior in aspects such as data computation, code path, and data flow. AssemblyNet is trained with a data prefetch task that predicts consecutive memory addresses. In the experiments, NPS outperforms SimPoint by up to 63%, reducing the average error by 38%. Additionally, NPS demonstrates strong robustness with increased accuracy, reducing the expensive accuracy tuning overhead. Furthermore, NPS shows higher accuracy and generality than the state-of-the-art GNN approach in code behavior learning, enabling the generation of high-quality execution embeddings.
arxiv情報
著者 | Yuanwei Fang,Zihao Liu,Yanheng Lu,Jiawei Liu,Jiajie Li,Yi Jin,Jian Chen,Yenkuang Chen,Hongzhong Zheng,Yuan Xie |
発行日 | 2023-04-18 10:13:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI