Evaluating Adversarial Robustness with Expected Viable Performance

要約

我々は、起こり得る敵対的摂動に関して期待される機能の観点から、特に敵対的摂動に注目して、分類器の堅牢性を評価するための指標を導入します。
分類器がテストされたときに、分類精度などの従来のパフォーマンスの尺度が実行可能な最小限のしきい値よりも小さい場合、分類器は摂動限界に関して機能しない (つまり、機能がゼロである) と見なされます。
その摂動限界からの例。
期待値の観点からロバスト性を定義することは、ロバスト性の定量化に対する領域一般的なアプローチによって動機付けられます。

要約(オリジナル)

We introduce a metric for evaluating the robustness of a classifier, with particular attention to adversarial perturbations, in terms of expected functionality with respect to possible adversarial perturbations. A classifier is assumed to be non-functional (that is, has a functionality of zero) with respect to a perturbation bound if a conventional measure of performance, such as classification accuracy, is less than a minimally viable threshold when the classifier is tested on examples from that perturbation bound. Defining robustness in terms of an expected value is motivated by a domain general approach to robustness quantification.

arxiv情報

著者 Ryan McCoppin,Colin Dawson,Sean M. Kennedy,Leslie M. Blaha
発行日 2023-09-18 16:47:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク