Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems

要約

自動運転車、顔認識、音声認識システムなどの人工知能 (AI) システムは、私たちの日常生活にますます組み込まれています。
ただし、その有用性にもかかわらず、これらの AI システムは、敵対的、バックドア、データ ポイズニング、メンバーシップ推論、モデル反転、モデル盗用攻撃などの幅広い攻撃に対して脆弱です。
特に、多くの攻撃は特定のモデルまたはシステムをターゲットにするように設計されていますが、その影響は他のターゲットに広がる可能性があり、これを転送可能攻撃と呼びます。
移転可能な攻撃の開発には多大な努力が払われてきましたが、移転可能な攻撃の進歩を全体的に理解することは依然として困難です。
このペーパーでは、特にサイバー物理セキュリティのコンテキスト内で、転送可能性の観点から学習ベースの攻撃を包括的に調査します。
画像、テキスト、グラフ、オーディオ、ビデオなどのさまざまなドメインを詳しく調査し、転送可能な攻撃の遍在性と蔓延性を浮き彫りにします。
このペーパーでは、データ、プロセス、モデル、システムなどのさまざまな観点から既存の攻撃のアーキテクチャを分類し、レビューします。
さらに、自動運転、音声認識、大規模言語モデル (LLM) などの実際的なシナリオにおける転送可能な攻撃の影響を調査します。
さらに、転送可能な攻撃の状況を調査する取り組みを奨励するために、潜在的な研究の方向性を概説します。
この調査は、蔓延している転送可能な攻撃と、さまざまなドメインにわたるその影響についての全体的な理解を提供します。

要約(オリジナル)

Artificial Intelligence (AI) systems such as autonomous vehicles, facial recognition, and speech recognition systems are increasingly integrated into our daily lives. However, despite their utility, these AI systems are vulnerable to a wide range of attacks such as adversarial, backdoor, data poisoning, membership inference, model inversion, and model stealing attacks. In particular, numerous attacks are designed to target a particular model or system, yet their effects can spread to additional targets, referred to as transferable attacks. Although considerable efforts have been directed toward developing transferable attacks, a holistic understanding of the advancements in transferable attacks remains elusive. In this paper, we comprehensively explore learning-based attacks from the perspective of transferability, particularly within the context of cyber-physical security. We delve into different domains — the image, text, graph, audio, and video domains — to highlight the ubiquitous and pervasive nature of transferable attacks. This paper categorizes and reviews the architecture of existing attacks from various viewpoints: data, process, model, and system. We further examine the implications of transferable attacks in practical scenarios such as autonomous driving, speech recognition, and large language models (LLMs). Additionally, we outline the potential research directions to encourage efforts in exploring the landscape of transferable attacks. This survey offers a holistic understanding of the prevailing transferable attacks and their impacts across different domains.

arxiv情報

著者 Guangjing Wang,Ce Zhou,Yuanda Wang,Bocheng Chen,Hanqing Guo,Qiben Yan
発行日 2023-11-20 14:29:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV パーマリンク