Sonic: Fast and Transferable Data Poisoning on Clustering Algorithms

要約

クラスタリング アルゴリズムに対するデータ ポイズニング攻撃はあまり注目されておらず、データセットのサイズや特徴量が増加するにつれて既存の手法を効率的に拡張するのが困難になっています。
これらの攻撃では通常、予測を生成して攻撃者の目的を評価するためにデータセット全体を複数回再クラスタリングする必要があり、そのスケーラビリティが大幅に妨げられます。
この論文は、HDBSCAN などのグラフベースおよび密度ベースのクラスタリング手法に対するポイズニング攻撃を加速する代理として、FISHDBC などの増分かつスケーラブルなクラスタリング アルゴリズムを活用する新しい遺伝的データ ポイズニング攻撃である Sonic を提案することで、これらの制限に対処します。
私たちは、ターゲットのクラスタリング アルゴリズムを汚染する際の Sonic の有効性と効率を経験的に実証します。
次に、クラスタリング アルゴリズムに対するポイズニング攻撃のスケーラビリティと伝達性に影響を与える要因の包括的な分析を実行し、攻撃戦略 Sonic におけるハイパーパラメータの堅牢性を調査して結論を​​導き出します。

要約(オリジナル)

Data poisoning attacks on clustering algorithms have received limited attention, with existing methods struggling to scale efficiently as dataset sizes and feature counts increase. These attacks typically require re-clustering the entire dataset multiple times to generate predictions and assess the attacker’s objectives, significantly hindering their scalability. This paper addresses these limitations by proposing Sonic, a novel genetic data poisoning attack that leverages incremental and scalable clustering algorithms, e.g., FISHDBC, as surrogates to accelerate poisoning attacks against graph-based and density-based clustering methods, such as HDBSCAN. We empirically demonstrate the effectiveness and efficiency of Sonic in poisoning the target clustering algorithms. We then conduct a comprehensive analysis of the factors affecting the scalability and transferability of poisoning attacks against clustering algorithms, and we conclude by examining the robustness of hyperparameters in our attack strategy Sonic.

arxiv情報

著者 Francesco Villani,Dario Lazzaro,Antonio Emanuele Cinà,Matteo Dell’Amico,Battista Biggio,Fabio Roli
発行日 2024-08-14 13:43:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.CV, cs.LG パーマリンク