要約
この作業は、パフォーマンスの低下につながる、物体検出における画像の小さくて一見無関係な摂動を調査して特定することを目的としています。
小ささは $L_p$ ノルムを使用して自然に定義できますが、発生した摂動とオブジェクトの間のピクセル距離によって、オブジェクトの「関連性」の程度を特徴付けます。
2 つの目的を満たしながら予測でエラーを引き起こすことは、遺伝的アルゴリズムを利用して検索を導く多目的最適化問題として定式化できます。
この結果は、画像の右側部分の (目に見えない) 摂動が、左側のオブジェクト検出の結果を大幅に変える可能性があることを示しています。
広範な評価により、変圧器ベースの物体検出ネットワークは、YOLOv5 などの単一段階の物体検出ネットワークと比較してバタフライ効果の影響を受けやすいという私たちの推測が再確認されました。
要約(オリジナル)
This work aims to explore and identify tiny and seemingly unrelated perturbations of images in object detection that will lead to performance degradation. While tininess can naturally be defined using $L_p$ norms, we characterize the degree of ‘unrelatedness’ of an object by the pixel distance between the occurred perturbation and the object. Triggering errors in prediction while satisfying two objectives can be formulated as a multi-objective optimization problem where we utilize genetic algorithms to guide the search. The result successfully demonstrates that (invisible) perturbations on the right part of the image can drastically change the outcome of object detection on the left. An extensive evaluation reaffirms our conjecture that transformer-based object detection networks are more susceptible to butterfly effects in comparison to single-stage object detection networks such as YOLOv5.
arxiv情報
著者 | Nguyen Anh Vu Doan,Arda Yüksel,Chih-Hong Cheng |
発行日 | 2022-11-14 16:07:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google