The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering

要約

ParClusterers Benchmark Suite (PCBS) を紹介します。これは、拡張性の高い並列グラフ クラスタリング アルゴリズムと、さまざまなグラフ クラスタリング アルゴリズムと実装の比較を合理化するベンチマーク ツールのコレクションです。
このベンチマークには、コミュニティ検出、分類、高密度サブグラフ マイニングなど、最新のクラスタリングの幅広いユースケースを対象としたクラスタリング アルゴリズムが含まれています。
ベンチマーク ツールキットを使用すると、さまざまなクラスタリング アルゴリズムの複数のインスタンスを簡単に実行して評価できます。これは、特定のタスクでのクラスタリングのパフォーマンスを微調整したり、クラスタリングの品質などのさまざまな関心のある指標に基づいてさまざまなクラスタリング アルゴリズムを比較したりするのに役立ちます。
そして走行時間。
PCBS を使用して、現実世界のグラフ クラスタリング データセットの広範なコレクションを評価します。
少し驚くべきことに、多くの一般的なグラフ クラスタリング ツールキットには含まれていないアルゴリズムによって最高品質の結果が得られることがわかりました。
PCBS は、スケーラブルなグラフ クラスタリング アルゴリズムの活発な研究分野の品質とパフォーマンスのトレードオフを評価および判断するための標準化された方法を提供します。
私たちは、これが将来、グラフ クラスタリング アルゴリズムの公正、正確、微妙な評価を可能にするのに役立つと信じています。

要約(オリジナル)

We introduce the ParClusterers Benchmark Suite (PCBS) — a collection of highly scalable parallel graph clustering algorithms and benchmarking tools that streamline comparing different graph clustering algorithms and implementations. The benchmark includes clustering algorithms that target a wide range of modern clustering use cases, including community detection, classification, and dense subgraph mining. The benchmark toolkit makes it easy to run and evaluate multiple instances of different clustering algorithms, which can be useful for fine-tuning the performance of clustering on a given task, and for comparing different clustering algorithms based on different metrics of interest, including clustering quality and running time. Using PCBS, we evaluate a broad collection of real-world graph clustering datasets. Somewhat surprisingly, we find that the best quality results are obtained by algorithms that not included in many popular graph clustering toolkits. The PCBS provides a standardized way to evaluate and judge the quality-performance tradeoffs of the active research area of scalable graph clustering algorithms. We believe it will help enable fair, accurate, and nuanced evaluation of graph clustering algorithms in the future.

arxiv情報

著者 Shangdi Yu,Jessica Shi,Jamison Meindl,David Eisenstat,Xiaoen Ju,Sasan Tavakkol,Laxman Dhulipala,Jakub Łącki,Vahab Mirrokni,Julian Shun
発行日 2024-11-15 15:47:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC, cs.LG, cs.SI パーマリンク