Benchmarking Performance of Deep Learning Model for Material Segmentation on Two HPC Systems


HPC システムのパフォーマンス ベンチマークは、パフォーマンスの向上とこれらのシステムを管理するジョブ スケジューラの改善を可能にする情報を提供することを目的とした継続的な取り組みです。
私たちは、機械学習モデルを利用し、GPU で高速化されたノードでマテリアル セグメンテーション分析を実行しながらパフォーマンス データを収集するベンチマーク ツールを開発します。
このベンチマークでは、MMdnn ツールキットと MINC-2500 データセットを使用して Caffe から PyTorch に変換された ML モデルを使用します。
パフォーマンス データは、Onyx と Vulcanite の 2 つの ERDC DSRC システムで収集されます。
データによれば、Vulcanite は多くのベンチマークでモデル時間が速い一方で、Onyx よりもパフォーマンスの低下を引き起こす可能性のあるいくつかの環境要因の影響を受けやすいことがわかります。
対照的に、Onyx のモデル時間はベンチマーク全体で一貫しています。


Performance Benchmarking of HPC systems is an ongoing effort that seeks to provide information that will allow for increased performance and improve the job schedulers that manage these systems. We develop a benchmarking tool that utilizes machine learning models and gathers performance data on GPU-accelerated nodes while they perform material segmentation analysis. The benchmark uses a ML model that has been converted from Caffe to PyTorch using the MMdnn toolkit and the MINC-2500 dataset. Performance data is gathered on two ERDC DSRC systems, Onyx and Vulcanite. The data reveals that while Vulcanite has faster model times in a large number of benchmarks, and it is also more subject to some environmental factors that can cause performances slower than Onyx. In contrast the model times from Onyx are consistent across benchmarks.


著者 Warren R. Williams,S. Ross Glandon,Luke L. Morris,Jing-Ru C. Cheng
発行日 2023-07-27 15:03:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.PF パーマリンク