AudioFool: Fast, Universal and synchronization-free Cross-Domain Attack on Speech Recognition

要約

自動音声認識システムは、デバイス上で実行されるコマンドを操作する敵対的な攻撃に対して脆弱であることがわかっています。
最近の研究は、このような攻撃を作成する方法の探索に焦点を当てていますが、無線 (OTA) 攻撃に関連するいくつかの問題は適切に対処されていません。
私たちの研究では、OTA モデルと互換性のある堅牢な攻撃に必要な特性を調べ、そのような任意の特性、つまり同期に対する不変性とフィルタリングに対する堅牢性を備えた攻撃を生成する方法を設計します。これにより、攻撃の拒否が可能になります。
– ASR システムに対するサービス (DoS) 攻撃。
これらの特性は、逆フーリエ変換を通じて変更された周波数領域で攻撃を構築することによって実現されます。
標準的なキーワード分類タスクに関する手法を評価して OTA で分析し、クロスドメイン攻撃の特性を分析してアプローチの効率性を説明します。

要約(オリジナル)

Automatic Speech Recognition systems have been shown to be vulnerable to adversarial attacks that manipulate the command executed on the device. Recent research has focused on exploring methods to create such attacks, however, some issues relating to Over-The-Air (OTA) attacks have not been properly addressed. In our work, we examine the needed properties of robust attacks compatible with the OTA model, and we design a method of generating attacks with arbitrary such desired properties, namely the invariance to synchronization, and the robustness to filtering: this allows a Denial-of-Service (DoS) attack against ASR systems. We achieve these characteristics by constructing attacks in a modified frequency domain through an inverse Fourier transform. We evaluate our method on standard keyword classification tasks and analyze it in OTA, and we analyze the properties of the cross-domain attacks to explain the efficiency of the approach.

arxiv情報

著者 Mohamad Fakih,Rouwaida Kanj,Fadi Kurdahi,Mohammed E. Fouda
発行日 2023-09-20 16:59:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.LG, eess.AS パーマリンク