Multilayer Correlation Clustering

要約

この論文では、相関クラスタリング (Bansal et al., FOCS ’02) を多層設定に新たに一般化した多層相関クラスタリングを確立します。
このモデルでは、共通セット $V$ に対する相関クラスタリング (レイヤーと呼ばれる) の一連の入力が与えられます。
次に、目標は、不一致ベクトルの $\ell_p$-norm ($p\geq 1$) を最小化する $V$ のクラスタリングを見つけることです。これは、ベクトル (層の数に等しい次元を持つ) として定義されます。
、その各要素は、対応するレイヤー上のクラスタリングの不一致を表します。
この一般化のために、最初に、よく知られた領域拡張手法に基づいて $O(L\log n)$ 近似アルゴリズムを設計します ($L$ は層の数です)。
次に、問題の重要な特殊ケース、つまり確率制約の問題を研究します。
この場合、最初に $(\alpha+2)$ 近似アルゴリズムを与えます。ここで、$\alpha$ は、単層の対応物に対して考えられる任意の近似比です。
たとえば、一般的には $\alpha=2.5$ (Ailon et al., JACM ’08) とし、重み付けされていない場合は $\alpha=1.73+\epsilon$ (Cohen-Addad et al., FOCS ’23) を取ることができます。

さらに、一般的な確率制約の場合における上記の $\alpha+2=4.5$ の近似比を改善する $4$ 近似アルゴリズムを設計します。
実世界のデータセットを使用した計算実験により、私たちが提案したアルゴリズムの有効性が実証されています。

要約(オリジナル)

In this paper, we establish Multilayer Correlation Clustering, a novel generalization of Correlation Clustering (Bansal et al., FOCS ’02) to the multilayer setting. In this model, we are given a series of inputs of Correlation Clustering (called layers) over the common set $V$. The goal is then to find a clustering of $V$ that minimizes the $\ell_p$-norm ($p\geq 1$) of the disagreements vector, which is defined as the vector (with dimension equal to the number of layers), each element of which represents the disagreements of the clustering on the corresponding layer. For this generalization, we first design an $O(L\log n)$-approximation algorithm, where $L$ is the number of layers, based on the well-known region growing technique. We then study an important special case of our problem, namely the problem with the probability constraint. For this case, we first give an $(\alpha+2)$-approximation algorithm, where $\alpha$ is any possible approximation ratio for the single-layer counterpart. For instance, we can take $\alpha=2.5$ in general (Ailon et al., JACM ’08) and $\alpha=1.73+\epsilon$ for the unweighted case (Cohen-Addad et al., FOCS ’23). Furthermore, we design a $4$-approximation algorithm, which improves the above approximation ratio of $\alpha+2=4.5$ for the general probability-constraint case. Computational experiments using real-world datasets demonstrate the effectiveness of our proposed algorithms.

arxiv情報

著者 Atsushi Miyauchi,Florian Adriaens,Francesco Bonchi,Nikolaj Tatti
発行日 2024-04-25 15:25:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG パーマリンク