Application Performance Modeling via Tensor Completion

要約

パフォーマンス チューニング、ソフトウェア/ハードウェアの共同設計、ジョブ スケジューリングなどは、アプリケーションのパフォーマンスを予測するためにモデルに依存する多くのタスクの 1 つです。
アプリケーションのパフォーマンスをモデリングするための低ランクのテンソル分解を提案し、評価します。
通常のグリッドを使用して、アプリケーションの入力ドメインと構成ドメインを離散化します。
グリッド セル内にマップされたアプリケーションの実行時間は平均化され、テンソル要素で表されます。
低ランク正準ポリアディック (CP) テンソル分解がこれらのテンソルを近似するのに効果的であることを示します。
さらに、この分解により、アプリケーションのパラメーター空間の未観測領域の正確な外挿が可能になることを示します。
次に、観察された実行時間のまばらなセットを考慮して、テンソル補完を使用して CP 分解を最適化します。
私たちは、6 つのアプリケーションに対して代替の区分/グリッドベースのモデルと教師あり学習モデルを検討し、テンソル補完を使用して最適化された CP 分解が、高次元パフォーマンス モデリングの予測精度とメモリ効率を向上させることを実証します。

要約(オリジナル)

Performance tuning, software/hardware co-design, and job scheduling are among the many tasks that rely on models to predict application performance. We propose and evaluate low-rank tensor decomposition for modeling application performance. We discretize the input and configuration domains of an application using regular grids. Application execution times mapped within grid-cells are averaged and represented by tensor elements. We show that low-rank canonical-polyadic (CP) tensor decomposition is effective in approximating these tensors. We further show that this decomposition enables accurate extrapolation of unobserved regions of an application’s parameter space. We then employ tensor completion to optimize a CP decomposition given a sparse set of observed execution times. We consider alternative piecewise/grid-based models and supervised learning models for six applications and demonstrate that CP decomposition optimized using tensor completion offers higher prediction accuracy and memory-efficiency for high-dimensional performance modeling.

arxiv情報

著者 Edward Hutter,Edgar Solomonik
発行日 2023-08-29 14:36:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG, cs.PF パーマリンク