ClonEval: An Open Voice Cloning Benchmark

要約

音声クローニングテキストからスピーチモデルの新しいベンチマークを提示します。
ベンチマークは、評価プロトコル、音声クローニングモデルのパフォーマンスを評価するためのオープンソースライブラリ、および付随するリーダーボードで構成されています。
この論文では、設計上の考慮事項について説明し、評価手順の詳細な説明を提示します。
ソフトウェアライブラリの使用については、リーダーボード上の結果の構成とともに説明されています。

要約(オリジナル)

We present a novel benchmark for voice cloning text-to-speech models. The benchmark consists of an evaluation protocol, an open-source library for assessing the performance of voice cloning models, and an accompanying leaderboard. The paper discusses design considerations and presents a detailed description of the evaluation procedure. The usage of the software library is explained, along with the organization of results on the leaderboard.

arxiv情報

著者 Iwona Christop,Tomasz Kuczyński,Marek Kubis
発行日 2025-04-29 09:36:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク