An Effective Method using Phrase Mechanism in Neural Machine Translation

要約

機械翻訳は、自然言語処理 (NLP) の重要なタスクの 1 つであり、実生活で大規模に応用されているだけでなく、NLP 研究コミュニティの他のタスクにも貢献しています。
最近、Transformer ベースの手法がこの分野で多くの研究者を魅了し、ほとんどのペア言語で最先端の結果を達成しました。
本稿では、ベトナム語と中国語の対訳コーパスのためのニューラル機械翻訳(NMT)システムを構築する際に、強力なベースラインモデルTransformerを改善するためのフレーズメカニズムPhraseTransformerを使用する効果的な方法を報告します。
VLSP 2022 コンテストの MT データセットに関する実験では、ベトナム語から中国語へのデータで 35.3 の BLEU スコア、中国語からベトナム語へのデータで 33.2 の BLEU スコアを達成しました。
私たちのコードは https://github.com/phuongnm94/PhraseTransformer で入手できます。

要約(オリジナル)

Machine Translation is one of the essential tasks in Natural Language Processing (NLP), which has massive applications in real life as well as contributing to other tasks in the NLP research community. Recently, Transformer -based methods have attracted numerous researchers in this domain and achieved state-of-the-art results in most of the pair languages. In this paper, we report an effective method using a phrase mechanism, PhraseTransformer, to improve the strong baseline model Transformer in constructing a Neural Machine Translation (NMT) system for parallel corpora Vietnamese-Chinese. Our experiments on the MT dataset of the VLSP 2022 competition achieved the BLEU score of 35.3 on Vietnamese to Chinese and 33.2 BLEU scores on Chinese to Vietnamese data. Our code is available at https://github.com/phuongnm94/PhraseTransformer.

arxiv情報

著者 Phuong Minh Nguyen,Le Minh Nguyen
発行日 2023-08-22 14:33:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク