Versatile Backdoor Attack with Visible, Semantic, Sample-Specific, and Compatible Triggers

要約

ディープ ニューラル ネットワーク (DNN) は、\textit{バックドア攻撃} と呼ばれる、無害なサンプルでのパフォーマンスに影響を与えることなく、特定のトリガー パターンにさらされたときに特定の動作を示すように操作できます。
現在、物理的なシナリオでのバックドア攻撃の実装は依然として大きな課題に直面しています。
物理的攻撃は労力と時間がかかり、トリガーは手動およびヒューリスティックな方法で選択されます。
さらに、デジタル攻撃を物理的なシナリオに拡大すると、視覚的な歪みに敏感であり、現実世界に対応するものが存在しないため、多くの課題に直面しています。
これらの課題に対処するために、\textbf{V}isible、\textbf{S}emantic、\textbf{S}ample-Specific、および \textbf{C}ompatible (VSSC) トリガーと呼ばれる新しいトリガーを定義し、効果的な処理を実現します。
、ステルス性と堅牢性を同時に備えており、対応するオブジェクトを使用して物理シナリオに効果的に展開することもできます。
VSSC トリガーを実装するために、3 つのモジュールで構成される自動パイプラインを提案します。大規模な言語モデルを活用して適切なトリガーを体系的に特定するトリガー選択モジュール、生成モデルを使用してトリガーを画像にシームレスに統合するトリガー挿入モジュール、および品質評価モジュールです。
ビジョン言語モデルを通じてトリガーの自然かつ成功した挿入を保証します。
広範な実験結果と分析により、VSSC トリガーの有効性、ステルス性、堅牢性が検証されています。
視覚的な歪みに対して堅牢性を維持できるだけでなく、物理的なシナリオでも強力な実用性を実証します。
私たちは、提案された VSSC トリガーと実装アプローチが、バックドア攻撃におけるより実用的なトリガーの設計に関する将来の研究のきっかけとなることを願っています。

要約(オリジナル)

Deep neural networks (DNNs) can be manipulated to exhibit specific behaviors when exposed to specific trigger patterns, without affecting their performance on benign samples, dubbed \textit{backdoor attack}. Currently, implementing backdoor attacks in physical scenarios still faces significant challenges. Physical attacks are labor-intensive and time-consuming, and the triggers are selected in a manual and heuristic way. Moreover, expanding digital attacks to physical scenarios faces many challenges due to their sensitivity to visual distortions and the absence of counterparts in the real world. To address these challenges, we define a novel trigger called the \textbf{V}isible, \textbf{S}emantic, \textbf{S}ample-Specific, and \textbf{C}ompatible (VSSC) trigger, to achieve effective, stealthy and robust simultaneously, which can also be effectively deployed in the physical scenario using corresponding objects. To implement the VSSC trigger, we propose an automated pipeline comprising three modules: a trigger selection module that systematically identifies suitable triggers leveraging large language models, a trigger insertion module that employs generative models to seamlessly integrate triggers into images, and a quality assessment module that ensures the natural and successful insertion of triggers through vision-language models. Extensive experimental results and analysis validate the effectiveness, stealthiness, and robustness of the VSSC trigger. It can not only maintain robustness under visual distortions but also demonstrates strong practicality in the physical scenario. We hope that the proposed VSSC trigger and implementation approach could inspire future studies on designing more practical triggers in backdoor attacks.

arxiv情報

著者 Ruotong Wang,Hongrui Chen,Zihao Zhu,Li Liu,Baoyuan Wu
発行日 2024-04-22 16:26:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.CV パーマリンク