要約
ブラックボックス敵対的攻撃は、モデルの構造や重みにアクセスすることなく、画像分類器を騙して画像を誤分類させることができる。最近の研究では、1,000回未満のクエリで95%以上の攻撃成功率が報告されています。そこで、画像分類を実現するためにクラウドAPIに依存するIoTデバイスに対して、ブラックボックス攻撃が現実的な脅威となったのかという疑問が生じる。この問題に光を当てるために、先行研究は主に成功率を高め、クエリー数を減らすことに焦点を当てていることに注目してください。しかし、クラウドAPIに対するブラックボックス攻撃のもう一つの重要な要因は、攻撃を実行するために必要な時間です。この論文では、ブラックボックス攻撃をローカルモデルではなくクラウドAPIに直接適用することで、画像のエンコードや前処理の前に摂動を適用する先行研究で犯した過ちを回避しています。さらに、負荷分散を利用して分散ブラックボックス攻撃を可能にすることで、局所探索法と勾配推定法の両方で攻撃時間を約5分の1に短縮することができる。
要約(オリジナル)
Black-box adversarial attacks can fool image classifiers into misclassifying images without requiring access to model structure and weights. Recent studies have reported attack success rates of over 95% with less than 1,000 queries. The question then arises of whether black-box attacks have become a real threat against IoT devices that rely on cloud APIs to achieve image classification. To shed some light on this, note that prior research has primarily focused on increasing the success rate and reducing the number of queries. However, another crucial factor for black-box attacks against cloud APIs is the time required to perform the attack. This paper applies black-box attacks directly to cloud APIs rather than to local models, thereby avoiding mistakes made in prior research that applied the perturbation before image encoding and pre-processing. Further, we exploit load balancing to enable distributed black-box attacks that can reduce the attack time by a factor of about five for both local search and gradient estimation methods.
arxiv情報
著者 | Han Wu,Sareh Rowlands,Johan Wahlstrom |
発行日 | 2024-07-05 14:18:18+00:00 |
arxivサイト | arxiv_id(pdf) |