BitE : Accelerating Learned Query Optimization in a Mixed-Workload Environment

要約

近年、深層強化学習をクエリ最適化に適用する多くの取り組みが行われていますが、クエリ オプティマイザーはワークロードとデータセットの手動設計の調整を必要とする複雑なエンティティであるため、改善の余地がまだ残っています。
最近の研究では、学習されたクエリの最適化の結果は、特定のワークロードの固有の特性を拾うことに焦点を当てた単一のワークロードのバルクでほとんどの結果が得られることが示されています。
これは、複数のワークロードとデータセットの異なる特性を混合して一緒に学習するシナリオでは問題となることがわかります。
今後、この論文では、データベース統計とメタデータを使用して、学習されたクエリ オプティマイザーを調整してパフォーマンスを向上させる新しいアンサンブル学習モデルである BitE を提案します。
途中で、いくつかの課題を解決するために複数のリビジョンを導入します。ヒントセットを拡張することで、最適な抽象 SQL プラン (ASP と呼ばれる JSON オブジェクトとして表される) の検索スペースを拡張し、偏っている可能性のあるデフォルトのプランからモデルを遠ざけます。
すべてのユニークなクエリプランを使用してエクスペリエンスを構成することで、従来の損失関数から逸脱し、報酬の過小評価と過大評価に対処するための代替方法を選択します。
当社のモデルは、同等レベルのリソースを使用しながら、既存の従来の方法と比較して、クエリの改善が 19.6% 増加し、クエリの後退が 15.8% 減少しました。

要約(オリジナル)

Although the many efforts to apply deep reinforcement learning to query optimization in recent years, there remains room for improvement as query optimizers are complex entities that require hand-designed tuning of workloads and datasets. Recent research present learned query optimizations results mostly in bulks of single workloads which focus on picking up the unique traits of the specific workload. This proves to be problematic in scenarios where the different characteristics of multiple workloads and datasets are to be mixed and learned together. Henceforth, in this paper, we propose BitE, a novel ensemble learning model using database statistics and metadata to tune a learned query optimizer for enhancing performance. On the way, we introduce multiple revisions to solve several challenges: we extend the search space for the optimal Abstract SQL Plan(represented as a JSON object called ASP) by expanding hintsets, we steer the model away from the default plans that may be biased by configuring the experience with all unique plans of queries, and we deviate from the traditional loss functions and choose an alternative method to cope with underestimation and overestimation of reward. Our model achieves 19.6% more improved queries and 15.8% less regressed queries compared to the existing traditional methods whilst using a comparable level of resources.

arxiv情報

著者 Yuri Kim,Yewon Choi,Yujung Gil,Sanghee Lee,Heesik Shin,Jaehyok Chong
発行日 2023-06-01 16:05:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DB, cs.LG パーマリンク