The First Parallel Corpora for Kurdish Sign Language

要約

クルド手話(KuSL)は、クルドのろう者の自然言語です。私たちは、クルド語の音声とKuSLの自動翻訳に取り組んでいます。手話は急速に発展し、文法規則も音声言語とは異なります。そのため、翻訳の際にはその違いを考慮する必要がある。私たちは、ソラニ(中央クルド)方言のクルド語テキストを、アバターを用いてクルド手話に自動翻訳することを提案しました。また、統計的機械翻訳(SMT)エンジンの学習に使用する、このペアの最初のパラレルコーパスを開発した。我々は、結果の理解度をテストし、BLEU(Bilingual Evaluation Understudy)を用いて評価した。結果は53.8%の精度を示しました。この分野での先行実験と比較すると、かなり高い結果である。その理由は、2つのペアの構造が似ているためと推測しています。今後は、このリソースをCC BY-NC-SA 4.0ライセンスのもと、Kurdish-BLARK(https://kurdishblark.github.io/)で一般公開する予定です。

要約(オリジナル)

Kurdish Sign Language (KuSL) is the natural language of the Kurdish Deaf people. We work on automatic translation between spoken Kurdish and KuSL. Sign languages evolve rapidly and follow grammatical rules that differ from spoken languages. Consequently,those differences should be considered during any translation. We proposed an avatar-based automatic translation of Kurdish texts in the Sorani (Central Kurdish) dialect into the Kurdish Sign language. We developed the first parallel corpora for that pair that we use to train a Statistical Machine Translation (SMT) engine. We tested the outcome understandability and evaluated it using the Bilingual Evaluation Understudy (BLEU). Results showed 53.8% accuracy. Compared to the previous experiments in the field, the result is considerably high. We suspect the reason to be the similarity between the structure of the two pairs. We plan to make the resources publicly available under CC BY-NC-SA 4.0 license on the Kurdish-BLARK (https://kurdishblark.github.io/).

arxiv情報

著者 Zina Kamal,Hossein Hassani
発行日 2023-05-11 12:10:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク