Neural Machine Translation For Low Resource Languages

要約

タイトル:低リソース言語のためのニューラル機械翻訳

要約:

– 自然言語の複雑性と流動性のため、ニューラル機械翻訳は難しい課題である。
– 最近はいくつかの言語ペアで最先端の性能を発揮してきた。
– 多言語ニューラル機械翻訳(MNMT)に関連する研究も増加しているが、何がうまくいくかを特定する包括的な調査はまだない。
– このプロジェクトの目的は、低リソース言語の領域を調査し、最先端の結果を達成するためのニューラル機械翻訳モデルを構築すること。
– この実装では、NLPやディープラーニングの技術(バックトランスレーションや転移学習など)を活用して、\texttt{mBART.CC25} \cite{liu2020multilingual} 言語モデルを拡張する戦略を探索している。
– この実装は、NMTアプリケーションのアーキテクチャを解説し、低リソース言語の問題領域内でアプリケーションを修正する機会を提供する異なるコンポーネントを特定することを試みる。

要約(オリジナル)

Neural Machine translation is a challenging task due to the inherent complex nature and the fluidity that natural languages bring. Nonetheless, in recent years, it has achieved state-of-the-art performance in several language pairs. Although, a lot of traction can be seen in the areas of multilingual neural machine translation (MNMT) in the recent years, there are no comprehensive survey done to identify what approaches work well. The goal of this project is to investigate the realm of low resource languages and build a Neural Machine Translation model to achieve state-of-the-art results. The project looks to build upon the \texttt{mBART.CC25} \cite{liu2020multilingual} language model and explore strategies to augment it with various NLP and Deep Learning techniques like back translation and transfer learning. This implementation tries to unpack the architecture of the NMT application and determine the different components which offers us opportunities to amend the said application within the purview of the low resource languages problem space.

arxiv情報

著者 Vakul Goyle,Kartikay Goyle,Parvathy Krishnaswamy,Kannan Girija Ravikumar,Utsa Chattopadhyay
発行日 2023-04-16 19:27:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク