要約
パッチの堅牢性認定により、サンプル上の特定の範囲内のパッチが深層学習モデルを操作して別のラベルを予測できないことが保証されます。
ただし、既存の技術では、分類器レベルまたはパッチ領域レベルで厳密な基準を満たさないサンプルを認定することはできません。
この論文では MajorCert を提案します。
MajorCert は、まず、基になる分類器全体で同じサンプル上の同じパッチ領域で操作可能なすべての可能なラベル セットを見つけ、次にそれらの組み合わせを要素ごとに列挙し、最後にこれらすべての組み合わせの多数不変式が損なわれていないかを確認してサンプルを認定します。
要約(オリジナル)
Patch robustness certification ensures no patch within a given bound on a sample can manipulate a deep learning model to predict a different label. However, existing techniques cannot certify samples that cannot meet their strict bars at the classifier or patch region levels. This paper proposes MajorCert. MajorCert firstly finds all possible label sets manipulatable by the same patch region on the same sample across the underlying classifiers, then enumerates their combinations element-wise, and finally checks whether the majority invariant of all these combinations is intact to certify samples.
arxiv情報
著者 | Qilin Zhou,Zhengyuan Wei,Haipeng Wang,W. K. Chan |
発行日 | 2023-09-07 12:22:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google