From Rule-Based Models to Deep Learning Transformers Architectures for Natural Language Processing and Sign Language Translation Systems: Survey, Taxonomy and Performance Evaluation

要約

世界中で聴覚障害者の人口が増加しており、認定手話通訳者の不足が続いているため、手話から光沢、テキスト、そしてその逆に至るまで、効率的で手話主導の統合されたエンドツーエンドの翻訳システムが緊急に必要とされています。
-その逆。
機械翻訳と関連するレビューについては豊富な研究が行われています。
しかし、手話の連続的かつ動的という特殊性を考慮した手話の機械翻訳に関する研究はほとんどありません。
この論文は、この空白に対処することを目的としており、手話機械翻訳アルゴリズムの時間的進化の遡及的分析と、言語翻訳で最も使用されているアプローチであるトランスフォーマー アーキテクチャの分類を提供します。
また、正確な深層学習アルゴリズムに支えられたリアルタイムのサービス品質手話機械翻訳システムの要件も示します。
手話翻訳システムの今後の研究の方向性を提案します。

要約(オリジナル)

With the growing Deaf and Hard of Hearing population worldwide and the persistent shortage of certified sign language interpreters, there is a pressing need for an efficient, signs-driven, integrated end-to-end translation system, from sign to gloss to text and vice-versa. There has been a wealth of research on machine translations and related reviews. However, there are few works on sign language machine translation considering the particularity of the language being continuous and dynamic. This paper aims to address this void, providing a retrospective analysis of the temporal evolution of sign language machine translation algorithms and a taxonomy of the Transformers architectures, the most used approach in language translation. We also present the requirements of a real-time Quality-of-Service sign language ma-chine translation system underpinned by accurate deep learning algorithms. We propose future research directions for sign language translation systems.

arxiv情報

著者 Nada Shahin,Leila Ismail
発行日 2024-08-27 07:11:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, I.2, I.2.7, I.4, I.4.9 パーマリンク