Approximate Tree Completion and Learning-Augmented Algorithms for Metric Minimum Spanning Trees

要約

任意のメトリック空間で$ n $ポイントの最小スパニングツリー(MST)を見つけることは、階層的クラスタリングや他の多くのMLタスクの基本的な原始的ですが、これには$ \ omega(n^2)$ $ $の時間がかかります。
最初に(1)実用的なヒューリスティックを使用して切断されたコンポーネントの森を見つけたメトリックMSTのフレームワークを導入し、(2)森の分離コンポーネントをスパニングツリーに接続するための小さな重量セットを見つけます。
2番目のステップを最適に解くことは、$ \ omega(n^2)$の時間がまだかかることを証明しますが、亜adratic 2.62承認アルゴリズムを提供します。
学習の高度アルゴリズムの精神で、ステップ(1)で見つかった森林が最適なMSTと重複している場合、近似係数が重複の尺度に依存する亜周年期の元のMST問題を近似できることを示します。
実際には、幅広いメトリックにはほぼ最適なスパニングツリーがありますが、正確なアルゴリズムよりも桁違いに桁違いになります。

要約(オリジナル)

Finding a minimum spanning tree (MST) for $n$ points in an arbitrary metric space is a fundamental primitive for hierarchical clustering and many other ML tasks, but this takes $\Omega(n^2)$ time to even approximate. We introduce a framework for metric MSTs that first (1) finds a forest of disconnected components using practical heuristics, and then (2) finds a small weight set of edges to connect disjoint components of the forest into a spanning tree. We prove that optimally solving the second step still takes $\Omega(n^2)$ time, but we provide a subquadratic 2.62-approximation algorithm. In the spirit of learning-augmented algorithms, we then show that if the forest found in step (1) overlaps with an optimal MST, we can approximate the original MST problem in subquadratic time, where the approximation factor depends on a measure of overlap. In practice, we find nearly optimal spanning trees for a wide range of metrics, while being orders of magnitude faster than exact algorithms.

arxiv情報

著者 Nate Veldt,Thomas Stanley,Benjamin W. Priest,Trevor Steil,Keita Iwabuchi,T. S. Jayram,Geoffrey Sanders
発行日 2025-02-18 16:13:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DM, cs.DS, cs.LG パーマリンク