バックドア ポイズニング攻撃は、ニューラル ネットワークによく知られたリスクをもたらします。
クリーンラベルのブラックボックス設定で動作し、ステルス毒とトリガーを使用し、既存の手法を上回る新しい攻撃である Silent Killer を紹介します。
私たちは MNIST、CIFAR10、および ImageNet の縮小版で徹底的な実験を実施し、最先端の結果を達成しています。
Backdoor poisoning attacks pose a well-known risk to neural networks. However, most studies have focused on lenient threat models. We introduce Silent Killer, a novel attack that operates in clean-label, black-box settings, uses a stealthy poison and trigger and outperforms existing methods. We investigate the use of universal adversarial perturbations as triggers in clean-label attacks, following the success of such approaches under poison-label settings. We analyze the success of a naive adaptation and find that gradient alignment for crafting the poison is required to ensure high success rates. We conduct thorough experiments on MNIST, CIFAR10, and a reduced version of ImageNet and achieve state-of-the-art results.
著者 | Tzvi Lederer,Gallil Maimon,Lior Rokach |
発行日 | 2023-10-01 16:32:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google