Machine Learning Systems are Bloated and Vulnerable



– 今日のソフトウェアは、ほとんどのユーザーには使用されていないコードや機能で肥大化している。
– この肥大化は、オペレーティングシステムからソフトウェアのバックエンド、フロントエンド、Webページまで、ソフトウェアスタック全体に広がっている。
– 本論文では、機械学習コンテナ内の肥大化を分析し、定量化することに焦点を当てる。
– MMLBというフレームワークを開発し、コンテナとパッケージレベルで存在する肥大化の量を測定する。
– このツールは肥大化の源を定量化し、脆弱性分析ツールと統合して、コンテナの脆弱性に対する肥大化の影響を評価することができる。
– Tensorflow、Pytorch、NVIDIAの15の機械学習コンテナを実験した結果、肥大化が重要な問題であることが示された。
– 一部の場合では、コンテナサイズの80%に相当する肥大化が発生することが示された。
– 肥大化は、コンテナのプロビジョニング時間を最大370%増加させ、脆弱性を最大99%重大化することが示された。


Today’s software is bloated with both code and features that are not used by most users. This bloat is prevalent across the entire software stack, from the operating system, all the way to software backends, frontends, and web-pages. In this paper, we focus on analyzing and quantifying bloat in machine learning containers. We develop MMLB, a framework to analyze bloat in machine learning containers, measuring the amount of bloat that exists on the container and package levels. Our tool quantifies the sources of bloat and integrates with vulnerability analysis tools to evaluate the impact of bloat on container vulnerabilities. Through experimentation with 15 machine learning containers from Tensorflow, Pytorch, and NVIDIA, we show that bloat is a significant issue, accounting for up to 80% of the container size in some cases. Our results demonstrate that bloat significantly increases the container provisioning time by up to 370% and exacerbates vulnerabilities by up to 99%.


著者 Huaifeng Zhang,Fahmi Abdulqadir Ahmed,Dyako Fatih,Akayou Kitessa,Mohannad Alhanahnah,Philipp Leitner,Ahmed Ali-Eldin
発行日 2023-05-08 11:04:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.LG, cs.SE パーマリンク