VoxAging: Continuously Tracking Speaker Aging with a Large-Scale Longitudinal Dataset in English and Mandarin

要約

スピーカー検証システムのパフォーマンスは、スピーカーの老化によって悪影響を受けます。
ただし、データ収集の課題、特に個人の持続的で大規模な縦断的データがないため、スピーカーの老化に関する研究は依然として困難です。
このホワイトペーパーでは、数年にわたって293人のスピーカー(226人の英語講演者と67人のマンダリンスピーカー)から収集された大規模な縦断的データセットであるボックスを提示し、最長の期間は17年(約900週間)に達します。
各スピーカーについて、データは毎週間隔で記録されました。
スピーカーの老化の現象と高度なスピーカー検証システムへの影響を研究し、個々のスピーカーの老化プロセスを分析し、スピーカー老化研究に対する年齢層や性別などの要因の影響を調査しました。

要約(オリジナル)

The performance of speaker verification systems is adversely affected by speaker aging. However, due to challenges in data collection, particularly the lack of sustained and large-scale longitudinal data for individuals, research on speaker aging remains difficult. In this paper, we present VoxAging, a large-scale longitudinal dataset collected from 293 speakers (226 English speakers and 67 Mandarin speakers) over several years, with the longest time span reaching 17 years (approximately 900 weeks). For each speaker, the data were recorded at weekly intervals. We studied the phenomenon of speaker aging and its effects on advanced speaker verification systems, analyzed individual speaker aging processes, and explored the impact of factors such as age group and gender on speaker aging research.

arxiv情報

著者 Zhiqi Ai,Meixuan Bao,Zhiyong Chen,Zhi Yang,Xinnuo Li,Shugong Xu
発行日 2025-05-27 17:16:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD パーマリンク