Sibyl: Adaptive and Extensible Data Placement in Hybrid Storage Systems Using Online Reinforcement Learning

要約

ハイブリッド ストレージ システム (HSS) は、複数の異なるストレージ デバイスを使用して、高性能で拡張性の高いストレージ容量を提供します。
最近の研究では、パフォーマンスが重要なデータを正確に識別して「最適な」ストレージ デバイスに配置することを目的としたさまざまな技術が提案されています。
残念ながら、これらの技術のほとんどは厳格であり、そのため、(1) 広範囲のワークロードやストレージ デバイス構成に対してうまく機能するための適応性が制限され、(2) 設計者がこれらの技術をさまざまなストレージ システム構成 (たとえば、ストレージ システム構成) に拡張することが困難になります。
、設計された構成とは異なる数または異なる種類のストレージ デバイスを使用します。
ハイブリッド ストレージ システムでのデータ配置に強化学習を使用する最初の技術である Sibyl を紹介します。
Sibyl は、実行中のワークロードとストレージ デバイスのさまざまな機能を観察して、システムを認識したデータ配置を決定します。
Sibyl は、意思決定を行うたびに、その決定による長期的なパフォーマンスへの影響を評価するために使用するシステムから報酬を受け取り、オンラインでのデータ配置ポリシーを継続的に最適化します。
さまざまな HSS 構成を備えた実際のシステムに Sibyl を実装します。
私たちの結果は、Sibyl が、以前の最良のデータ配置手法と比較して、パフォーマンス重視/コスト重視の HSS 構成において 21.6%/19.9% のパフォーマンス向上をもたらすことを示しています。
3 つの異なるストレージ デバイスを備えた HSS 構成を使用した評価では、Sibyl が最先端のデータ配置ポリシーを 23.9% ~ 48.2% 上回っており、同時に組み込むことができるデータ配置メカニズムの設計におけるシステム アーキテクトの負担を大幅に軽減していることが示されています。
3 つのストレージ デバイス。
Sibyl は、わずか 124.4 KiB という非常に控えめなストレージ オーバーヘッドを発生させながら、将来のアクセス パターンを完全に把握している Oracle ポリシーのパフォーマンスの 80% を達成することを示します。

要約(オリジナル)

Hybrid storage systems (HSS) use multiple different storage devices to provide high and scalable storage capacity at high performance. Recent research proposes various techniques that aim to accurately identify performance-critical data to place it in a ‘best-fit’ storage device. Unfortunately, most of these techniques are rigid, which (1) limits their adaptivity to perform well for a wide range of workloads and storage device configurations, and (2) makes it difficult for designers to extend these techniques to different storage system configurations (e.g., with a different number or different types of storage devices) than the configuration they are designed for. We introduce Sibyl, the first technique that uses reinforcement learning for data placement in hybrid storage systems. Sibyl observes different features of the running workload as well as the storage devices to make system-aware data placement decisions. For every decision it makes, Sibyl receives a reward from the system that it uses to evaluate the long-term performance impact of its decision and continuously optimizes its data placement policy online. We implement Sibyl on real systems with various HSS configurations. Our results show that Sibyl provides 21.6%/19.9% performance improvement in a performance-oriented/cost-oriented HSS configuration compared to the best previous data placement technique. Our evaluation using an HSS configuration with three different storage devices shows that Sibyl outperforms the state-of-the-art data placement policy by 23.9%-48.2%, while significantly reducing the system architect’s burden in designing a data placement mechanism that can simultaneously incorporate three storage devices. We show that Sibyl achieves 80% of the performance of an oracle policy that has complete knowledge of future access patterns while incurring a very modest storage overhead of only 124.4 KiB.

arxiv情報

著者 Gagandeep Singh,Rakesh Nadig,Jisung Park,Rahul Bera,Nastaran Hajinazar,David Novo,Juan Gómez-Luna,Sander Stuijk,Henk Corporaal,Onur Mutlu
発行日 2023-11-16 13:28:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.AR, cs.DC, cs.LG パーマリンク