LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect

要約

チュニジアのアラビア方言の自動音声認識(ASR)システムの開発は、方言の言語的な複雑さと注釈付き音声データセットの不足のために困難である。このような課題を解決するために、私たちはチュニジアのアラビア方言の音韻と語彙の特徴を捉えた包括的なリソースであるLinTO音声およびテキストデータセットを提案します。これらのデータセットには、様々なソースからの様々なテキストと、多様な話者が登場し、チュニジア・アラビア方言と英語またはフランス語とのコードスイッチングを行う実世界の音声サンプルが含まれています。LinTOオーディオとテキストデータセットは、高品質のオーディオと正確なトランスクリプションを提供することで、チュニジア・アラビア方言のASRシステムを構築し、ベンチマークするための定性的な材料を提供することを目的としている。 キーワード — チュニジア語アラビア方言、音声対テキスト、低資源言語、音声データ補強

要約(オリジナル)

Developing Automatic Speech Recognition (ASR) systems for Tunisian Arabic Dialect is challenging due to the dialect’s linguistic complexity and the scarcity of annotated speech datasets. To address these challenges, we propose the LinTO audio and textual datasets — comprehensive resources that capture phonological and lexical features of Tunisian Arabic Dialect. These datasets include a variety of texts from numerous sources and real-world audio samples featuring diverse speakers and code-switching between Tunisian Arabic Dialect and English or French. By providing high-quality audio paired with precise transcriptions, the LinTO audio and textual datasets aim to provide qualitative material to build and benchmark ASR systems for the Tunisian Arabic Dialect. Keywords — Tunisian Arabic Dialect, Speech-to-Text, Low-Resource Languages, Audio Data Augmentation

arxiv情報

著者 Hedi Naouara,Jean-Pierre Lorré,Jérôme Louradour
発行日 2025-04-03 14:05:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク