Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain

要約

この記事では、Huawei Translation Service Center (HW-TSC) による (WMT 2024) のスペインの低リソース言語への翻訳タスクの提出状況を紹介します。
私たちは、スペイン語からアラゴン語 (es-arg)、スペイン語からアラネ語 (es-arn)、スペイン語からアストゥリアス語 (es-ast) の 3 つの翻訳タスクに参加しました。
これら 3 つの翻訳タスクでは、多言語転送、正則化ドロップアウト、前方翻訳と逆翻訳、ラブセノイズ除去、変換アンサンブル学習などのトレーニング戦略や、ディープ トランスフォーマー ビッグ アーキテクチャのトレーニングに基づくニューラル機械翻訳 (NMT) モデルのその他の戦略を使用します。
これらの強化戦略を使用することで、私たちの提出物は最終評価で競争力のある結果を達成しました。

要約(オリジナル)

This article introduces the submission status of the Translation into Low-Resource Languages of Spain task at (WMT 2024) by Huawei Translation Service Center (HW-TSC). We participated in three translation tasks: spanish to aragonese (es-arg), spanish to aranese (es-arn), and spanish to asturian (es-ast). For these three translation tasks, we use training strategies such as multilingual transfer, regularized dropout, forward translation and back translation, labse denoising, transduction ensemble learning and other strategies to neural machine translation (NMT) model based on training deep transformer-big architecture. By using these enhancement strategies, our submission achieved a competitive result in the final evaluation.

arxiv情報

著者 Yuanchang Luo,Zhanglin Wu,Daimeng Wei,Hengchao Shang,Zongyao Li,Jiaxin Guo,Zhiqiang Rao,Shaojun Li,Jinlong Yang,Yuhao Xie,Jiawei Zheng Bin Wei,Hao Yang
発行日 2024-09-24 09:46:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク