Adversarial Detection by Approximation of Ensemble Boundary

要約

ブール関数のスペクトル近似は、2 クラス パターン認識問題を解決するディープ ニューラル ネットワーク (DNN) のアンサンブルの決定境界を近似するために提案されています。
比較的弱い DNN 分類子の Walsh の組み合わせは、敵対的攻撃を検出できることが実験的に示されています。
クリーンな画像と敵対的な画像の間のウォルシュ係数近似の違いを観察することにより、攻撃の転送可能性が検出に使用される可能性があるようです。
決定境界を近似することは、DNN の学習と伝達可能性の特性を理解するのにも役立ちます。
ここでの実験では画像を使用しますが、2 クラスのアンサンブル決定境界をモデル化するという提案されたアプローチは、原則としてあらゆるアプリケーション領域に適用できます。
ウォルシュ係数を実装するこの論文のコード人工ブール関数を近似する例は、https://doi.org/10.24433/CO.3695905.v1 にあります。

要約(オリジナル)

A spectral approximation of a Boolean function is proposed for approximating the decision boundary of an ensemble of Deep Neural Networks (DNNs) solving two-class pattern recognition problems. The Walsh combination of relatively weak DNN classifiers is shown experimentally to be capable of detecting adversarial attacks. By observing the difference in Walsh coefficient approximation between clean and adversarial images, it appears that transferability of attack may be used for detection. Approximating the decision boundary may also aid in understanding the learning and transferability properties of DNNs. While the experiments here use images, the proposed approach of modelling two-class ensemble decision boundaries could in principle be applied to any application area. Code for this paper implementing Walsh Coefficient Examples of approximating artificial Boolean functions can be found at https://doi.org/10.24433/CO.3695905.v1

arxiv情報

著者 T. Windeatt
発行日 2022-12-13 16:03:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG パーマリンク