Voice Morphing: Two Identities in One Voice

要約

生体認証システムでは、通常、各生体認証サンプルまたはテンプレートが 1 つの ID に関連付けられます。
しかし、最近の研究では、複数のアイデンティティとうまく一致できる「モーフ」生体認証サンプルを生成できる可能性が実証されました。
モーフ攻撃は現在、生体認証システムに対する潜在的なセキュリティ脅威として認識されています。
ただし、ほとんどのモーフ攻撃は、顔、指紋、虹彩などの画像領域で動作する生体認証モダリティに対して研究されています。
この予備作業では、Voice Identity Morphing (VIM) を導入します。これは、2 人の個人の声の特徴を偽装する音声サンプルを合成できる音声ベースのモーフィング攻撃です。
私たちの実験では、2 つの一般的な話者認識システム、ECAPA-TDNN と x-vector の VIM に対する脆弱性を評価し、Librispeech データセット上で 1% の誤一致率で 80% 以上の成功率 (MMMPR) を達成しました。

要約(オリジナル)

In a biometric system, each biometric sample or template is typically associated with a single identity. However, recent research has demonstrated the possibility of generating ‘morph’ biometric samples that can successfully match more than a single identity. Morph attacks are now recognized as a potential security threat to biometric systems. However, most morph attacks have been studied on biometric modalities operating in the image domain, such as face, fingerprint, and iris. In this preliminary work, we introduce Voice Identity Morphing (VIM) – a voice-based morph attack that can synthesize speech samples that impersonate the voice characteristics of a pair of individuals. Our experiments evaluate the vulnerabilities of two popular speaker recognition systems, ECAPA-TDNN and x-vector, to VIM, with a success rate (MMPMR) of over 80% at a false match rate of 1% on the Librispeech dataset.

arxiv情報

著者 Sushanta K. Pani,Anurag Chowdhury,Morgan Sandler,Arun Ross
発行日 2023-09-05 17:36:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.SD, eess.AS パーマリンク