要約
この技術レポートでは、VoxCeleb2023 Speaker Recognition Challenge (VoxSRC 2023) のトラック 1 (非公開) の ChinaTelecom システムについて説明します。
私たちのシステムは、VoxCeleb2 のみでトレーニングされたいくつかの ResNet バリアントで構成されており、後でパフォーマンスを向上させるために融合されました。
スコア校正も各バリアントと融合システムに適用されました。
最終的な提出では、minDCF 0.1066 および EER 1.980% を達成しました。
要約(オリジナル)
This technical report describes ChinaTelecom system for Track 1 (closed) of the VoxCeleb2023 Speaker Recognition Challenge (VoxSRC 2023). Our system consists of several ResNet variants trained only on VoxCeleb2, which were fused for better performance later. Score calibration was also applied for each variant and the fused system. The final submission achieved minDCF of 0.1066 and EER of 1.980%.
arxiv情報
著者 | Mengjie Du,Xiang Fang,Jie Li |
発行日 | 2023-08-16 07:21:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google