要約
バックドア攻撃を成功させるには、挿入されたデータに正しくラベルが付けられている必要があります。
それ以外の場合は、基本的なデータ フィルターでも簡単に検出できます。
そこで、クリーンラベル攻撃の概念が導入されました。これは、注入されたデータのラベルを変更する必要がないため、より危険です。
私たちの知る限り、既存のクリーンラベルのバックドア攻撃は、トレーニング セット全体またはその一部の理解に大きく依存しています。
ただし、実際には、トレーニング データセットは複数の独立したソースから収集されることが多いため、攻撃者がこれを入手することは非常に困難です。
現在のすべてのクリーンラベル攻撃とは異なり、私たちは「ヤドクガエル」と呼ばれる新しいクリーンラベル手法を提案します。
ヤドクガエルはトレーニング データへのアクセスを必要としません。
必要なのは、「カエル」などの攻撃対象クラスに関する知識だけです。
CIFAR10、Tiny-ImageNet、および TSRD では、トレーニング セット サイズのわずか 0.1\%、0.025\%、および 0.4\% の中毒率で、ヤドクガエルは LC、HTBA、
BadNets、およびブレンド。
さらに、最先端の攻撃である NARCISSUS と比較して、ヤドクガエルはトレーニング データなしでも同様の攻撃成功率を達成します。
最後に、4 つの典型的なバックドア防御アルゴリズムがヤドクガエルに対抗するのに苦労していることを示します。
要約(オリジナル)
To successfully launch backdoor attacks, injected data needs to be correctly labeled; otherwise, they can be easily detected by even basic data filters. Hence, the concept of clean-label attacks was introduced, which is more dangerous as it doesn’t require changing the labels of injected data. To the best of our knowledge, the existing clean-label backdoor attacks largely relies on an understanding of the entire training set or a portion of it. However, in practice, it is very difficult for attackers to have it because of training datasets often collected from multiple independent sources. Unlike all current clean-label attacks, we propose a novel clean label method called ‘Poison Dart Frog’. Poison Dart Frog does not require access to any training data; it only necessitates knowledge of the target class for the attack, such as ‘frog’. On CIFAR10, Tiny-ImageNet, and TSRD, with a mere 0.1\%, 0.025\%, and 0.4\% poisoning rate of the training set size, respectively, Poison Dart Frog achieves a high Attack Success Rate compared to LC, HTBA, BadNets, and Blend. Furthermore, compared to the state-of-the-art attack, NARCISSUS, Poison Dart Frog achieves similar attack success rates without any training data. Finally, we demonstrate that four typical backdoor defense algorithms struggle to counter Poison Dart Frog.
arxiv情報
著者 | Binhao Ma,Jiahui Wang,Dejun Wang,Bo Meng |
発行日 | 2023-08-21 11:06:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google