要約
BELEBELE を拡張することにより、初の高度に多言語の音声およびアメリカ手話 (ASL) 理解データセットを導入します。
私たちのデータセットは、BELEBELE と FLEURS が交わる 74 の音声言語と 1 つの手話 (ASL) をカバーしています。
2M-BELEBELE データセットを 5 ショット設定とゼロショット設定の両方で評価しましたが、言語間で、音声理解の精度は読解と比較して平均で約 2 ~ 3% 低かったです。
要約(オリジナル)
We introduce the first highly multilingual speech and American Sign Language (ASL) comprehension dataset by extending BELEBELE. Our dataset covers 74 spoken languages at the intersection of BELEBELE and FLEURS, and one sign language (ASL). We evaluate 2M-BELEBELE dataset for both 5-shot and zero-shot settings and across languages, the speech comprehension accuracy is ~ 2-3% average lower compared to reading comprehension.
arxiv情報
著者 | Marta R. Costa-jussà,Bokai Yu,Pierre Andrews,Belen Alastruey,Necati Cihan Camgoz,Joe Chuang,Jean Maillard,Christophe Ropers,Arina Turkantenko,Carleigh Wood |
発行日 | 2024-12-18 18:56:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google