要約
音声クローニングテキストからスピーチモデルの新しいベンチマークを提示します。
ベンチマークは、評価プロトコル、音声クローニングモデルのパフォーマンスを評価するためのオープンソースライブラリ、および付随するリーダーボードで構成されています。
この論文では、設計上の考慮事項について説明し、評価手順の詳細な説明を提示します。
ソフトウェアライブラリの使用については、リーダーボード上の結果の構成とともに説明されています。
要約(オリジナル)
We present a novel benchmark for voice cloning text-to-speech models. The benchmark consists of an evaluation protocol, an open-source library for assessing the performance of voice cloning models, and an accompanying leaderboard. The paper discusses design considerations and presents a detailed description of the evaluation procedure. The usage of the software library is explained, along with the organization of results on the leaderboard.
arxiv情報
著者 | Iwona Christop,Tomasz Kuczyński,Marek Kubis |
発行日 | 2025-04-29 09:36:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google