要約
効率的な検索クエリのために設計された従来のデータ構造を改善するために、機械学習アドバイスの統合を研究します。
機械学習アドバイスを使用して、バイナリ検索ツリーのパフォーマンスを改善するための最近の努力がありましたが、Lin et。
アル。
(ICML 2022)、それにもかかわらず、結果として生じる構造は、複数のアップデートにわたってバランスを維持する複雑さや部分的に順序付けられたまたは高次元のデータセットを処理できないなど、バイナリ検索ツリーの固有の弱点に苦しんでいます。
これらの理由により、この作業ではスキップリストとKDツリーに焦点を当てています。
アイテムのセットで検索クエリの推定された分数周波数を出力する可能性のある誤ったOracleへのアクセスを考慮して、2倍近くで最適な予想検索時間を提供するスキップリストとKDツリーを構築します。
実際、Oracleが一定の要因内でのみ正確であっても、学習式の高級スキップリストとKDツリーは依然として一定の要因まで最適です。
また、予測が任意に間違っている場合でも、忘れられないスキップリスト/KDツリー構造の一定の係数内にある予想される検索時間をデータ構造が達成することを示すことにより、堅牢性を示します。
最後に、学習式の高度検索データ構造が、合成データセットと現実世界の両方のデータセットで対応する従来のアナログよりも優れていることを経験的に示します。
要約(オリジナル)
We study the integration of machine learning advice to improve upon traditional data structure designed for efficient search queries. Although there has been recent effort in improving the performance of binary search trees using machine learning advice, e.g., Lin et. al. (ICML 2022), the resulting constructions nevertheless suffer from inherent weaknesses of binary search trees, such as complexity of maintaining balance across multiple updates and the inability to handle partially-ordered or high-dimensional datasets. For these reasons, we focus on skip lists and KD trees in this work. Given access to a possibly erroneous oracle that outputs estimated fractional frequencies for search queries on a set of items, we construct skip lists and KD trees that provably provides the optimal expected search time, within nearly a factor of two. In fact, our learning-augmented skip lists and KD trees are still optimal up to a constant factor, even if the oracle is only accurate within a constant factor. We also demonstrate robustness by showing that our data structures achieves an expected search time that is within a constant factor of an oblivious skip list/KD tree construction even when the predictions are arbitrarily incorrect. Finally, we empirically show that our learning-augmented search data structures outperforms their corresponding traditional analogs on both synthetic and real-world datasets.
arxiv情報
著者 | Chunkai Fu,Brandon G. Nguyen,Jung Hoon Seo,Ryan Zesch,Samson Zhou |
発行日 | 2025-03-07 16:10:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google