Evaluating Adversarial Robustness: A Comparison Of FGSM, Carlini-Wagner Attacks, And The Role of Distillation as Defense Mechanism

要約

この技術レポートでは、特に画像分類に利用されるディープ ニューラル ネットワーク (DNN) をターゲットとした敵対的攻撃を詳しく調査します。
この研究では、機械学習モデルの堅牢性を強化することを目的とした防御メカニズムも調査されています。
この研究は、高速勾配符号法 (FGSM) と Carlini-Wagner (CW) アプローチという 2 つの著名な攻撃手法の影響を理解することに焦点を当てています。
これらの攻撃は、Tiny-ImageNet データセットを利用した、Resnext50_32x4d、DenseNet-201、および VGG-19 の 3 つの事前トレーニング済み画像分類器に関して調査されています。
さらに、この研究は、FGSM および CW 攻撃に対抗する防御メカニズムとしての防御蒸留の堅牢性を提案しています。
この防御メカニズムは CIFAR-10 データセットを使用して評価されます。CNN モデル、具体的には resnet101 と Resnext50_32x4d がそれぞれ教師モデルと生徒モデルとして機能します。
提案された防御的蒸留モデルは、FGSM などの攻撃を阻止するのに有効です。
ただし、CW 攻撃などのより高度な手法に対して依然として影響を受けやすいことが指摘されています。
この文書では、提案されたスキームの綿密な検証が示されています。
詳細かつ包括的な結果を提供し、採用された防御メカニズムの有効性と限界を解明します。
この研究は、厳密な実験と分析を通じて、DNN に対する敵対的攻撃のダイナミクスと、その影響を軽減するための防御戦略の有効性についての洞察を提供します。

要約(オリジナル)

This technical report delves into an in-depth exploration of adversarial attacks specifically targeted at Deep Neural Networks (DNNs) utilized for image classification. The study also investigates defense mechanisms aimed at bolstering the robustness of machine learning models. The research focuses on comprehending the ramifications of two prominent attack methodologies: the Fast Gradient Sign Method (FGSM) and the Carlini-Wagner (CW) approach. These attacks are examined concerning three pre-trained image classifiers: Resnext50_32x4d, DenseNet-201, and VGG-19, utilizing the Tiny-ImageNet dataset. Furthermore, the study proposes the robustness of defensive distillation as a defense mechanism to counter FGSM and CW attacks. This defense mechanism is evaluated using the CIFAR-10 dataset, where CNN models, specifically resnet101 and Resnext50_32x4d, serve as the teacher and student models, respectively. The proposed defensive distillation model exhibits effectiveness in thwarting attacks such as FGSM. However, it is noted to remain susceptible to more sophisticated techniques like the CW attack. The document presents a meticulous validation of the proposed scheme. It provides detailed and comprehensive results, elucidating the efficacy and limitations of the defense mechanisms employed. Through rigorous experimentation and analysis, the study offers insights into the dynamics of adversarial attacks on DNNs, as well as the effectiveness of defensive strategies in mitigating their impact.

arxiv情報

著者 Trilokesh Ranjan Sarkar,Nilanjan Das,Pralay Sankar Maitra,Bijoy Some,Ritwik Saha,Orijita Adhikary,Bishal Bose,Jaydip Sen
発行日 2024-04-05 17:51:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.CV, cs.LG パーマリンク