要約
AI によって生成された歌声の急速な進歩により、自然な人間の歌声が忠実に模倣され、楽譜とシームレスに一致するようになったことで、アーティストや音楽業界の懸念が高まっています。
話し声とは異なり、歌声はその音楽的性質と強力なバックグラウンド ミュージックの存在により独特の課題を抱えており、歌声ディープフェイク検出 (SVDD) は集中的な注意が必要な専門分野となっています。
SVDD 研究を促進するために、私たちは最近「SVDD チャレンジ」を提案しました。これは、研究室管理および実地での本物のディープフェイク歌声録音の SVDD に焦点を当てた最初の研究課題です。
このチャレンジは、2024 年の IEEE 音声言語技術ワークショップ (SLT 2024) と併せて開催されます。
要約(オリジナル)
The rapid advancement of AI-generated singing voices, which now closely mimic natural human singing and align seamlessly with musical scores, has led to heightened concerns for artists and the music industry. Unlike spoken voice, singing voice presents unique challenges due to its musical nature and the presence of strong background music, making singing voice deepfake detection (SVDD) a specialized field requiring focused attention. To promote SVDD research, we recently proposed the ‘SVDD Challenge,’ the very first research challenge focusing on SVDD for lab-controlled and in-the-wild bonafide and deepfake singing voice recordings. The challenge will be held in conjunction with the 2024 IEEE Spoken Language Technology Workshop (SLT 2024).
arxiv情報
著者 | You Zhang,Yongyi Zang,Jiatong Shi,Ryuichi Yamamoto,Jionghao Han,Yuxun Tang,Tomoki Toda,Zhiyao Duan |
発行日 | 2024-05-08 17:40:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google