Towards Measuring and Scoring Speaker Diarization Fairness

要約

話者ダイアライゼーション、つまり「誰がいつ話したか」を見つけるタスクは、現在、ほぼすべての音声処理アプリケーションで使用されています。
それにもかかわらず、その偏りを1つずつ研究するプロトコルがなかったため、その公平性はまだ評価されていません.
この論文では、話者ダイアライゼーションの公平性を評価するために設計されたプロトコルとスコアリング方法を提案します。
このプロトコルは、発話の大規模なデータセットに適用され、性別、年齢、話者のアクセント、話された文の長さに応じて、話者ダイアライゼーションのパフォーマンスを報告します。
最先端の話者ダイアライゼーション手法を適用したところ、性別または話者のアクセントによって引き起こされたいくつかのバイアスが特定されました。

要約(オリジナル)

Speaker diarization, or the task of finding ‘who spoke and when’, is now used in almost every speech processing application. Nevertheless, its fairness has not yet been evaluated because there was no protocol to study its biases one by one. In this paper we propose a protocol and a scoring method designed to evaluate speaker diarization fairness. This protocol is applied on a large dataset of spoken utterances and report the performances of speaker diarization depending on the gender, the age, the accent of the speaker and the length of the spoken sentence. Some biases induced by the gender, or the accent of the speaker were identified when we applied a state-of-the-art speaker diarization method.

arxiv情報

著者 Yannis Tevissen,Jérôme Boudy,Gérard Chollet,Frédéric Petitpont
発行日 2023-02-20 14:07:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク