要約
このペーパーでは、ESETHUフレームワークを紹介します。これは、地域社会に力を与え、言語リソースから公平な利益共有を確保するために特別に設計された持続可能なデータキュレーションフレームワークです。
このフレームワークは、新しいコミュニティ中心のデータライセンスであるEsethuライセンスによってサポートされています。
概念実証として、Esethuフレームワークとライセンスの下で開発されたオープンソースコーパスであるVuk’uzenzele isixhosa Speech Dataset(VIXSD)を紹介します。
人口統計学的および言語的メタデータを豊かにしたネイティブIsixhosaスピーカーからの読み取りスピーチを含むデータセットは、コミュニティ主導のライセンスとキュレーションの原則が、データクリエーターの関心を保護しながら、アフリカ言語の自動音声認識(ASR)の資源ギャップをどのように埋めることができるかを示しています。
データセットの開発をガイドするフレームワークについて説明し、ESETHUライセンスの規定の概要を説明し、VIXSDの方法論を提示し、ISIXHOSAの音声駆動型アプリケーションの構築と洗練におけるVIXSDの使いやすさを検証するASR実験を提示します。
要約(オリジナル)
This paper presents the Esethu Framework, a sustainable data curation framework specifically designed to empower local communities and ensure equitable benefit-sharing from their linguistic resource. This framework is supported by the Esethu license, a novel community-centric data license. As a proof of concept, we introduce the Vuk’uzenzele isiXhosa Speech Dataset (ViXSD), an open-source corpus developed under the Esethu Framework and License. The dataset, containing read speech from native isiXhosa speakers enriched with demographic and linguistic metadata, demonstrates how community-driven licensing and curation principles can bridge resource gaps in automatic speech recognition (ASR) for African languages while safeguarding the interests of data creators. We describe the framework guiding dataset development, outline the Esethu license provisions, present the methodology for ViXSD, and present ASR experiments validating ViXSD’s usability in building and refining voice-driven applications for isiXhosa.
arxiv情報
著者 | Jenalea Rajab,Anuoluwapo Aremu,Everlyn Asiko Chimoto,Dale Dunbar,Graham Morrissey,Fadel Thior,Luandrie Potgieter,Jessico Ojo,Atnafu Lambebo Tonja,Maushami Chetty,Wilhelmina NdapewaOnyothi Nekoto,Pelonomi Moiloa,Jade Abbott,Vukosi Marivate,Benjamin Rosman |
発行日 | 2025-06-12 15:10:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google