Token-Modification Adversarial Attacks for Natural Language Processing: A Survey

要約

現在、自然言語処理システムに対する敵対的攻撃が数多く存在します。
これらのうち、大多数は個々のドキュメント トークンを変更することで成功します。これをここではトークン変更攻撃と呼びます。
各トークン変更攻撃は、敵対者に対する制約や特定の検索アルゴリズムなど、基本的なコンポーネントの特定の組み合わせによって定義されます。
この観察を動機として、私たちは既存のトークン変更攻撃を調査し、それぞれの構成要素を抽出します。
当社では、攻撃に依存しないフレームワークを使用して調査を構成し、その結果、分野を効果的に分類し、コンポーネントを簡単に比較できます。
この調査は、新しい研究者をこの分野に導き、個々の攻撃コンポーネントに関するさらなる研究を促すことを目的としています。

要約(オリジナル)

There are now many adversarial attacks for natural language processing systems. Of these, a vast majority achieve success by modifying individual document tokens, which we call here a token-modification attack. Each token-modification attack is defined by a specific combination of fundamental components, such as a constraint on the adversary or a particular search algorithm. Motivated by this observation, we survey existing token-modification attacks and extract the components of each. We use an attack-independent framework to structure our survey which results in an effective categorisation of the field and an easy comparison of components. This survey aims to guide new researchers to this field and spark further research into individual attack components.

arxiv情報

著者 Tom Roth,Yansong Gao,Alsharif Abuadbba,Surya Nepal,Wei Liu
発行日 2023-08-07 03:25:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CR, cs.LG パーマリンク