要約
多くの機械学習モデルは敵対的攻撃の影響を受けやすく、実際のアプリケーションでは意思決定ベースのブラックボックス攻撃が最も重大な脅威となります。
これらの攻撃は非常にステルス性が高く、ターゲットの機械学習モデルから取得したハードラベルを使用して敵対的な例を生成します。
これは通常、クエリ集中型の正確な検索によって特定された決定境界に基づいて摂動方向を最適化することで実現され、攻撃の成功率を大幅に制限します。
この論文では、決定境界を正確に決定することなく、摂動方向を効率的かつ正確に比較するための近似決定境界 (ADB) を使用した新しいアプローチを紹介します。
当社の ADB アプローチ (ADBA) の有効性は、適切な ADB を迅速に特定し、すべての摂動方向を確実に区別できるかどうかにかかっています。
この目的のために、我々は決定境界の確率分布を分析し、分布の中央値をADBとして使用することで異なる摂動方向を効果的に区別できることを確認し、ADBA-mdアルゴリズムの開発を生み出しました。
ADBA-md では、摂動方向のペアを区別するのに平均 4 つのクエリのみが必要であり、クエリ効率が非常に優れています。
6 つのよく知られた画像分類器に関する広範な実験により、ADBA および ADBA-md が複数の最先端のブラックボックス攻撃よりも優れていることが明確に実証されました。
要約(オリジナル)
Many machine learning models are susceptible to adversarial attacks, with decision-based black-box attacks representing the most critical threat in real-world applications. These attacks are extremely stealthy, generating adversarial examples using hard labels obtained from the target machine learning model. This is typically realized by optimizing perturbation directions, guided by decision boundaries identified through query-intensive exact search, significantly limiting the attack success rate. This paper introduces a novel approach using the Approximation Decision Boundary (ADB) to efficiently and accurately compare perturbation directions without precisely determining decision boundaries. The effectiveness of our ADB approach (ADBA) hinges on promptly identifying suitable ADB, ensuring reliable differentiation of all perturbation directions. For this purpose, we analyze the probability distribution of decision boundaries, confirming that using the distribution’s median value as ADB can effectively distinguish different perturbation directions, giving rise to the development of the ADBA-md algorithm. ADBA-md only requires four queries on average to differentiate any pair of perturbation directions, which is highly query-efficient. Extensive experiments on six well-known image classifiers clearly demonstrate the superiority of ADBA and ADBA-md over multiple state-of-the-art black-box attacks.
arxiv情報
著者 | Feiyang Wang,Xingquan Zuo,Hai Huang,Gang Chen |
発行日 | 2024-06-07 15:09:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google