Breaking 3-Factor Approximation for Correlation Clustering in Polylogarithmic Rounds

要約

この論文では、2 つの異なるエンティティのすべてのペアに類似または非類似のラベルが付けられる、相関クラスタリング問題の並列アルゴリズムを研究します。
目標は、エンティティをクラスターに分割して、ラベルとの不一致の数を最小限に抑えることです。
現在、すべての効率的な並列アルゴリズムの近似比は少なくとも 3 です。多項式時間逐次アルゴリズム [CLN22] によって達成される $1.994+\epsilon$ 比と比較すると、大きなギャップが存在します。
我々は、3 よりも優れた近似比を達成する最初の多対数深度並列アルゴリズムを提案します。具体的には、我々のアルゴリズムは $(2.4+\epsilon)$ 近似解を計算し、 $\tilde{O}(m^{1.5} を使用します)
)$働きます。
さらに、$\tilde{O}(m^{1.5})$ 時間逐次アルゴリズムや、$\tilde{O}(m^{1.5} を使用した多対数丸めサブリニアメモリ MPC アルゴリズムに変換できます。
)$ 合計メモリ。
私たちのアプローチは、Awerbuch、Khandekar、および Rao の [AKR12] 長さ制限付きマルチ商品フロー アルゴリズムに触発されており、Charikar、Guruswami、および Wirth [CGW05] の切り捨てられた相関クラスタリング線形プログラムを解決する効率的な並列アルゴリズムを開発します。
次に、[CMSY15] のフレームワークを使用して、切り捨て線形計画の解を最大 2.4 の損失係数で丸めることができることを示します。
このような丸めフレームワークは、並列ピボットベースのアプローチを使用して実装できます。

要約(オリジナル)

In this paper, we study parallel algorithms for the correlation clustering problem, where every pair of two different entities is labeled with similar or dissimilar. The goal is to partition the entities into clusters to minimize the number of disagreements with the labels. Currently, all efficient parallel algorithms have an approximation ratio of at least 3. In comparison with the $1.994+\epsilon$ ratio achieved by polynomial-time sequential algorithms [CLN22], a significant gap exists. We propose the first poly-logarithmic depth parallel algorithm that achieves a better approximation ratio than 3. Specifically, our algorithm computes a $(2.4+\epsilon)$-approximate solution and uses $\tilde{O}(m^{1.5})$ work. Additionally, it can be translated into a $\tilde{O}(m^{1.5})$-time sequential algorithm and a poly-logarithmic rounds sublinear-memory MPC algorithm with $\tilde{O}(m^{1.5})$ total memory. Our approach is inspired by Awerbuch, Khandekar, and Rao’s [AKR12] length-constrained multi-commodity flow algorithm, where we develop an efficient parallel algorithm to solve a truncated correlation clustering linear program of Charikar, Guruswami, and Wirth [CGW05]. Then we show the solution of the truncated linear program can be rounded with a factor of at most 2.4 loss by using the framework of [CMSY15]. Such a rounding framework can then be implemented using parallel pivot-based approaches.

arxiv情報

著者 Nairen Cao,Shang-En Huang,Hsin-Hao Su
発行日 2023-07-13 12:32:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.DS, cs.LG パーマリンク