Sequential and Shared-Memory Parallel Algorithms for Partitioned Local Depths

要約

この研究では、パーティション化されたローカル深度 (PaLD) のシーケンシャル共有メモリ並列アルゴリズムを設計、分析、最適化します。
PaLD は、一連のデータ ポイントとペアごとの距離が与えられた場合、相対距離に基づいてペアごとの関係の強さを識別する方法であり、コミュニティのサイズやコミュニティ内の絶対距離が大きく異なる場合でも、密集したコミュニティと疎なコミュニティ内の強いつながりを識別できるようになります。
ペアごとの距離のトリプレット比較を通じてコミュニティ構造分析を実行する 2 つのアルゴリズムのバリアントを設計します。
計算コストと通信コストの理論的分析を示し、一定の係数までは逐次アルゴリズムが通信に最適であることを証明します。
Intel マルチコア CPU 上で最大 $32$ のスレッドを使用して、ベースラインのシーケンシャル実装と比較して最大 $29\times$ のシーケンシャルの高速化と、最適化されたシーケンシャル実装と比較して最大 $19.4\time$ の並列の高速化を実現するパフォーマンス最適化戦略を導入します。

要約(オリジナル)

In this work, we design, analyze, and optimize sequential and shared-memory parallel algorithms for partitioned local depths (PaLD). Given a set of data points and pairwise distances, PaLD is a method for identifying strength of pairwise relationships based on relative distances, enabling the identification of strong ties within dense and sparse communities even if their sizes and within-community absolute distances vary greatly. We design two algorithmic variants that perform community structure analysis through triplet comparisons of pairwise distances. We present theoretical analyses of computation and communication costs and prove that the sequential algorithms are communication optimal, up to constant factors. We introduce performance optimization strategies that yield sequential speedups of up to $29\times$ over a baseline sequential implementation and parallel speedups of up to $19.4\times$ over optimized sequential implementations using up to $32$ threads on an Intel multicore CPU.

arxiv情報

著者 Aditya Devarakonda,Grey Ballard
発行日 2023-07-31 13:32:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68W10, cs.DC, cs.LG, D.1.3, stat.ML パーマリンク