Watertox: The Art of Simplicity in Universal Attacks A Cross-Model Framework for Robust Adversarial Generation

要約

現代の敵対的攻撃手法は、モデル間の移行性と実際の適用性において重大な制限に直面しています。
アーキテクチャの多様性と正確に制御された摂動を通じて顕著な効果を実現するエレガントな敵対的攻撃フレームワークである Watertox を紹介します。
2 段階の高速勾配符号法では、均一なベースライン摂動 ($\epsilon_1 = 0.1$) とターゲットを絞った強化 ($\epsilon_2 = 0.4$) を組み合わせます。
このフレームワークは、VGG から ConvNeXt までの相補的なアーキテクチャのアンサンブルを活用し、革新的な投票メカニズムを通じて多様な視点を統合します。
最先端のアーキテクチャに対して、Watertox はモデルの精度を 70.6% から 16.0% に低下させ、ゼロショット攻撃では、未知のアーキテクチャに対して最大 98.8% の精度低下を達成します。
これらの結果は、Watertox が敵対的方法論における重要な進歩であることを証明し、ビジュアル セキュリティ システムや CAPTCHA 生成への応用が有望であることを示しています。

要約(オリジナル)

Contemporary adversarial attack methods face significant limitations in cross-model transferability and practical applicability. We present Watertox, an elegant adversarial attack framework achieving remarkable effectiveness through architectural diversity and precision-controlled perturbations. Our two-stage Fast Gradient Sign Method combines uniform baseline perturbations ($\epsilon_1 = 0.1$) with targeted enhancements ($\epsilon_2 = 0.4$). The framework leverages an ensemble of complementary architectures, from VGG to ConvNeXt, synthesizing diverse perspectives through an innovative voting mechanism. Against state-of-the-art architectures, Watertox reduces model accuracy from 70.6% to 16.0%, with zero-shot attacks achieving up to 98.8% accuracy reduction against unseen architectures. These results establish Watertox as a significant advancement in adversarial methodologies, with promising applications in visual security systems and CAPTCHA generation.

arxiv情報

著者 Zhenghao Gao,Shengjie Xu,Meixi Chen,Fangyao Zhao
発行日 2024-12-20 14:17:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.CV パーマリンク