ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale

要約

ASVspoof 5 は、音声スプーフィングとディープフェイク攻撃の研究、および検出ソリューションの設計を促進する一連の課題の第 5 版です。
以前の課題と比較して、ASVspoof 5 データベースは、さまざまな音響条件で非常に多くの話者から収集されたクラウドソース データから構築されています。
攻撃もクラウドソースで行われ、代理検出モデルを使用して生成およびテストされますが、敵対的攻撃が初めて組み込まれます。
新しい指標は、なりすましに強い自動話者検証 (SASV) の評価と、スタンドアロンの検出ソリューション、つまり ASV を使用しない対策の評価をサポートします。
2 つのチャレンジ トラック、新しいデータベース、評価指標、ベースライン、評価プラットフォームについて説明し、結果の概要を示します。
攻撃によりベースライン システムが大幅に侵害される一方、送信により大幅な改善がもたらされます。

要約(オリジナル)

ASVspoof 5 is the fifth edition in a series of challenges that promote the study of speech spoofing and deepfake attacks, and the design of detection solutions. Compared to previous challenges, the ASVspoof 5 database is built from crowdsourced data collected from a vastly greater number of speakers in diverse acoustic conditions. Attacks, also crowdsourced, are generated and tested using surrogate detection models, while adversarial attacks are incorporated for the first time. New metrics support the evaluation of spoofing-robust automatic speaker verification (SASV) as well as stand-alone detection solutions, i.e., countermeasures without ASV. We describe the two challenge tracks, the new database, the evaluation metrics, baselines, and the evaluation platform, and present a summary of the results. Attacks significantly compromise the baseline systems, while submissions bring substantial improvements.

arxiv情報

著者 Xin Wang,Hector Delgado,Hemlata Tak,Jee-weon Jung,Hye-jin Shim,Massimiliano Todisco,Ivan Kukanov,Xuechen Liu,Md Sahidullah,Tomi Kinnunen,Nicholas Evans,Kong Aik Lee,Junichi Yamagishi
発行日 2024-08-16 13:37:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SD, eess.AS パーマリンク