LearnedSort as a learning-augmented SampleSort: Analysis and Parallelization


この研究では、累積分布関数に基づく機械学習モデルを使用して並べ替える新しいアルゴリズムである LearnedSort を分析し、並列化します。
LearnedSort は予測を備えたアルゴリズムのレンズの下で分析されており、LearnedSort は学習拡張された SampleSort であると主張されています。
並列 LearnedSort アルゴリズムは、LearnedSort と最先端の SampleSort 実装である IPS4o を組み合わせて開発されています。
合成データセットと現実世界のデータセットのベンチマークは、IPS4o や他の並べ替えアルゴリズムと比較して、並列 LearnedSort の並列パフォーマンスが向上していることを示しています。


This work analyzes and parallelizes LearnedSort, the novel algorithm that sorts using machine learning models based on the cumulative distribution function. LearnedSort is analyzed under the lens of algorithms with predictions, and it is argued that LearnedSort is a learning-augmented SampleSort. A parallel LearnedSort algorithm is developed combining LearnedSort with the state-of-the-art SampleSort implementation, IPS4o. Benchmarks on synthetic and real-world datasets demonstrate improved parallel performance for parallel LearnedSort compared to IPS4o and other sorting algorithms.


著者 Ivan Carvalho,Ramon Lawrence
発行日 2023-07-17 16:53:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DB, cs.LG パーマリンク