Differential Evolution based Dual Adversarial Camouflage: Fooling Human Eyes and Object Detectors

要約

最近の研究では、ディープ ニューラル ネットワーク (DNN) ベースのオブジェクト検出器は、画像に摂動を追加する形で敵対的攻撃を受けやすく、オブジェクト検出器の出力が正しくないことが明らかになりました。
現在の既存の研究のほとんどは、オブジェクト検出器をだますために、敵対的な例とも呼ばれる摂動画像の生成に焦点を当てています。
生成された敵対的な例自体は一定の自然さを保つことができますが、それらのほとんどは人間の目で簡単に観察できるため、現実世界でのさらなる適用が制限されます。
この問題を軽減するために、人間の目とオブジェクト検出器を同時にだますための 2 つの段階で構成される差分進化ベースのデュアル敵対的カモフラージュ (DE_DAC) メソッドを提案します。
具体的には、オブジェクトの表面にレンダリングできるカモフラージュ テ​​クスチャを取得しようとします。
第 1 段階では、グローバル テクスチャを最適化して、レンダリングされたオブジェクトとシーン画像の間の不一致を最小限に抑え、人間の目を区別しにくくします。
第 2 段階では、3 つの損失関数を設計してローカル テクスチャを最適化し、オブジェクト検出器を無効にします。
さらに、差分進化アルゴリズムを導入して、攻撃するオブジェクトの最適に近い領域を検索し、特定の攻撃領域の制限の下で敵対的なパフォーマンスを向上させます。
また、環境に適応できる適応型 DE_DAC の性能についても研究しています。
実験は、提案された方法が、複数の特定のシーンとオブジェクトの下で、だます人間の目とオブジェクト検出器との間の適切なトレードオフを取得できることを示しています。

要約(オリジナル)

Recent studies reveal that deep neural network (DNN) based object detectors are vulnerable to adversarial attacks in the form of adding the perturbation to the images, leading to the wrong output of object detectors. Most current existing works focus on generating perturbed images, also called adversarial examples, to fool object detectors. Though the generated adversarial examples themselves can remain a certain naturalness, most of them can still be easily observed by human eyes, which limits their further application in the real world. To alleviate this problem, we propose a differential evolution based dual adversarial camouflage (DE_DAC) method, composed of two stages to fool human eyes and object detectors simultaneously. Specifically, we try to obtain the camouflage texture, which can be rendered over the surface of the object. In the first stage, we optimize the global texture to minimize the discrepancy between the rendered object and the scene images, making human eyes difficult to distinguish. In the second stage, we design three loss functions to optimize the local texture, making object detectors ineffective. In addition, we introduce the differential evolution algorithm to search for the near-optimal areas of the object to attack, improving the adversarial performance under certain attack area limitations. Besides, we also study the performance of adaptive DE_DAC, which can be adapted to the environment. Experiments show that our proposed method could obtain a good trade-off between the fooling human eyes and object detectors under multiple specific scenes and objects.

arxiv情報

著者 Jialiang Sun,Tingsong Jiang,Wen Yao,Donghua Wang,Xiaoqian Chen
発行日 2023-01-01 13:19:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク