要約
敵対的攻撃手法における最近の研究の進歩にも関わらず、XAI モニターに対する現在のアプローチは依然として発見可能であり、時間がかかります。
この論文では、XAI モニター下でステルスで説明可能かつ効率的な PGD 画像分類敵対的攻撃を可能にするアテンション マスク生成の適応フレームワークを紹介します。
具体的には、PGD 攻撃を誘導するためのアテンション マスク生成に、変異 XAI 混合物とマルチタスク自己教師あり X-UNet を利用します。
MNIST (MLP)、CIFAR-10 (AlexNet) での実験では、SOTA 防御で保護された分類子を効果的に欺くために重要なステルス性、効率性、説明可能性のバランスにおいて、私たちのシステムがベンチマークの PGD、Sparsefool、SOTA SINIFGSM よりも優れたパフォーマンスを発揮できることが示されました。
要約(オリジナル)
Despite recent research advancements in adversarial attack methods, current approaches against XAI monitors are still discoverable and slower. In this paper, we present an adaptive framework for attention mask generation to enable stealthy, explainable and efficient PGD image classification adversarial attack under XAI monitors. Specifically, we utilize mutation XAI mixture and multitask self-supervised X-UNet for attention mask generation to guide PGD attack. Experiments on MNIST (MLP), CIFAR-10 (AlexNet) have shown that our system can outperform benchmark PGD, Sparsefool and SOTA SINIFGSM in balancing among stealth, efficiency and explainability which is crucial for effectively fooling SOTA defense protected classifiers.
arxiv情報
著者 | Yunfan Shi |
発行日 | 2024-11-07 15:13:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google