Game Theoretic Mixed Experts for Combinational Adversarial Machine Learning

要約

タイトル:Combinational Adversarial Machine Learningのためのゲーム理論的複合専門家

要約:

– 最近のAdversarial Machine Learningの進展により、強固と考えられていた防御手法が、弱点を狙った攻撃に対して脆弱であることが示された。
– これらの防御手法にはBarrage of Random Transforms(BaRT)、Friendly Adversarial Training(FAT)、Trash is Treasure(TiT)、Vision Transformers(ViTs)、Big Transfer model、Spiking Neural Networks(SNNs)で構成されるアンサンブルモデルが含まれる。
– 1つの防御手法によって生成されたカスタマイズされた攻撃のAdversarial Exampleは、別の防御手法によって誤分類されることが少ないことを示す転移性分析を実施する。
– この結果から、2つの重要な問題が生じる。すなわち、防御手法間の低い転移性をゲーム理論的枠組みでどのように利用して、強度を高めることができるか。また、この枠組み内で、攻撃者はどのようにして効果的なマルチモデル攻撃を開発できるか。
– この論文では、アンサンブルのAdversarial AttackとDefenseのためのゲーム理論的枠組みであるGaMEを提供する。
– GaMEは、コンポーネントAdversarial Attackを使用している攻撃者が対峙する場合、ディテクターをベースにした防御手法と標準的な防御手法の両方のMixed-Nash戦略を見つけるように設計されている。
– さらに、ランダムな変換、マルチモデル投票方式、Adversarial Detectorアーキテクチャに対応する3つの新しい攻撃アルゴリズムを提案する。
– これらの攻撃は、GaMEフレームワークによって生成された防御手法を強化することと、未知の攻撃に対する強度を検証することの両方に役立つ。
– 全体的に、我々の枠組みと分析は、構成的な攻撃と防御方法を提供することによって、Adversarial Machine Learningの分野を前進させる。

要約(オリジナル)

Recent advances in adversarial machine learning have shown that defenses considered to be robust are actually susceptible to adversarial attacks which are specifically customized to target their weaknesses. These defenses include Barrage of Random Transforms (BaRT), Friendly Adversarial Training (FAT), Trash is Treasure (TiT) and ensemble models made up of Vision Transformers (ViTs), Big Transfer models and Spiking Neural Networks (SNNs). We first conduct a transferability analysis, to demonstrate the adversarial examples generated by customized attacks on one defense, are not often misclassified by another defense. This finding leads to two important questions. First, how can the low transferability between defenses be utilized in a game theoretic framework to improve the robustness? Second, how can an adversary within this framework develop effective multi-model attacks? In this paper, we provide a game-theoretic framework for ensemble adversarial attacks and defenses. Our framework is called Game theoretic Mixed Experts (GaME). It is designed to find the Mixed-Nash strategy for both a detector based and standard defender, when facing an attacker employing compositional adversarial attacks. We further propose three new attack algorithms, specifically designed to target defenses with randomized transformations, multi-model voting schemes, and adversarial detector architectures. These attacks serve to both strengthen defenses generated by the GaME framework and verify their robustness against unforeseen attacks. Overall, our framework and analyses advance the field of adversarial machine learning by yielding new insights into compositional attack and defense formulations.

arxiv情報

著者 Ethan Rathbun,Kaleel Mahmood,Sohaib Ahmad,Caiwen Ding,Marten van Dijk
発行日 2023-04-29 16:41:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.GT, cs.LG, I.2 パーマリンク