FastLloyd: Federated, Accurate, Secure, and Tunable $k$-Means Clustering with Differential Privacy

要約

私たちは、プライバシーを摂取する$ k $ -meansクラスタリングの水平方向に連携した設定の問題を研究しています。
安全な計算を使用した既存のフェデレーションアプローチは、かなりのオーバーヘッドに悩まされており、出力プライバシーを提供しません。
同時に、差別的にプライベート(DP)$ K $ -MEANSアルゴリズムは、ローカルDPモデルにノイズを追加することにより、信頼できる中央キュレーターまたは大幅に劣化したユーティリティを想定しています。
安全なDPソリューションと中央のDPソリューションを素朴に組み合わせると、非現実的なオーバーヘッドを備えたプロトコルが得られます。
代わりに、私たちの作業は、DPと安全な計算コンポーネントの両方の強化を提供し、以前の作業よりも速く、よりプライベートで、より正確な設計をもたらします。
計算DPモデルを利用することにより、最先端の関連作業よりも5桁スピードアップを達成する軽量で安全な集約ベースのアプローチを設計します。
さらに、DPの中央モデルで最先端の有用性を維持するだけでなく、新しいDPクラスタリングメカニズムを設計することにより、ユーティリティをさらに改善します。

要約(オリジナル)

We study the problem of privacy-preserving $k$-means clustering in the horizontally federated setting. Existing federated approaches using secure computation suffer from substantial overheads and do not offer output privacy. At the same time, differentially private (DP) $k$-means algorithms either assume a trusted central curator or significantly degrade utility by adding noise in the local DP model. Naively combining the secure and central DP solutions results in a protocol with impractical overhead. Instead, our work provides enhancements to both the DP and secure computation components, resulting in a design that is faster, more private, and more accurate than previous work. By utilizing the computational DP model, we design a lightweight, secure aggregation-based approach that achieves five orders of magnitude speed-up over state-of-the-art related work. Furthermore, we not only maintain the utility of the state-of-the-art in the central model of DP, but we improve the utility further by designing a new DP clustering mechanism.

arxiv情報

著者 Abdulrahman Diaa,Thomas Humphries,Florian Kerschbaum
発行日 2025-04-01 15:45:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク