CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds

要約

この論文では、乳児の泣き声にラベルを付けたコレクションである Ubenwa CryCeleb データセットと、それに伴う泣き声に基づく公衆話者検証チャレンジである CryCeleb 2023 タスクについて説明します。
私たちは、乳児の泣き声分析の研究を促進することを目的として、786 人の新生児から手動でセグメント化された 6 時間以上の泣き声を学術目的で公開しました。
第 1 回公開コンテストには 59 名の参加者が集まり、そのうち 11 名がベースラインのパフォーマンスを向上させました。
最高性能のシステムは、等誤り率 25.8% という大幅な改善を達成しましたが、これは最先端の成人話者認証システムの性能にはまだ程遠いものです。
したがって、このデータセットについては、検証タスクを超えてさらに研究を進める余地があると考えています。

要約(オリジナル)

This paper describes the Ubenwa CryCeleb dataset – a labeled collection of infant cries – and the accompanying CryCeleb 2023 task, which is a public speaker verification challenge based on cry sounds. We released more than 6 hours of manually segmented cry sounds from 786 newborns for academic use, aiming to encourage research in infant cry analysis. The inaugural public competition attracted 59 participants, 11 of whom improved the baseline performance. The top-performing system achieved a significant improvement scoring 25.8% equal error rate, which is still far from the performance of state-of-the-art adult speaker verification systems. Therefore, we believe there is room for further research on this dataset, potentially extending beyond the verification task.

arxiv情報

著者 David Budaghyan,Charles C. Onu,Arsenii Gorin,Cem Subakan,Doina Precup
発行日 2024-03-21 17:52:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS パーマリンク