Deep learning based Auto Tuning for Database Management System

要約

タイトル:Deep learning based Auto Tuning for Database Management System
要約:

– データベースシステムの構成管理は、システムのすべての側面を制御する何百もの構成ツマミがあるため、困難なタスクである。
– これらのツマミは標準化されておらず、独立していないため、最適な設定を決定するのは困難である。
– この問題に対処する自動化されたアプローチを実装するために、教師ありと教師なしの機械学習手法を使用して影響を与えるツマミを選択し、目に見えないワークロードをマップし、ツマミの設定を推奨するOtterTuneという新しいツールが開発され、3つのDBMSで評価されています。
– 結果は、既存のツールや人間の専門家が生成した設定と同じかそれ以上に優れた構成を推奨することを示しています。
– この研究では、Ottertuneに基づく自動化されたテクニックを、以前のセッションで収集したトレーニングデータを再利用して、教師ありと教師なしの機械学習手法を使用して、レイテンシー予測を改善するために拡張します。
– 当社のアプローチには、GMMクラスタリングを使用してメトリックをプルーニングし、RandomForestなどのアンサンブルモデルとニューラルネットワークのような非線形モデルを組み合わせた予測モデルを使用します。

要約(オリジナル)

The management of database system configurations is a challenging task, as there are hundreds of configuration knobs that control every aspect of the system. This is complicated by the fact that these knobs are not standardized, independent, or universal, making it difficult to determine optimal settings. An automated approach to address this problem using supervised and unsupervised machine learning methods to select impactful knobs, map unseen workloads, and recommend knob settings was implemented in a new tool called OtterTune and is being evaluated on three DBMSs, with results demonstrating that it recommends configurations as good as or better than those generated by existing tools or a human expert.In this work, we extend an automated technique based on Ottertune [1] to reuse training data gathered from previous sessions to tune new DBMS deployments with the help of supervised and unsupervised machine learning methods to improve latency prediction. Our approach involves the expansion of the methods proposed in the original paper. We use GMM clustering to prune metrics and combine ensemble models, such as RandomForest, with non-linear models, like neural networks, for prediction modeling.

arxiv情報

著者 Karthick Prasad Gunasekaran,Kajal Tiwari,Rachana Acharya
発行日 2023-04-25 11:52:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.DB, cs.LG パーマリンク