LEAPT: Learning Adaptive Prefix-to-prefix Translation For Simultaneous Machine Translation


リアルタイムの翻訳を目的とする同時機械翻訳は、多くのライブ シナリオで役立ちますが、精度と待ち時間のトレードオフが原因で非常に困難です。
両方のバランスを実現するには、モデルは適切なストリーミング テキスト (READ ポリシー) を待ってから、その翻訳を生成する (WRITE ポリシー) 必要があります。
ただし、以前の作業の WRITE ポリシーは、エンドツーエンドのトレーニングのためにメソッド自体に固有であるか、非エンドツーエンドのトレーニングのトレーニングとデコードの間の入力の不一致に悩まされています。
したがって、同時機械翻訳のための一般的で優れた WRITE ポリシーを学ぶことが不可欠です。
人間の通訳者が利用する戦略と「待機」ポリシーに着想を得て、LEAPT と呼ばれる新しい適応プレフィックス間トレーニング ポリシーを提案します。これにより、機械翻訳モデルはソース文のプレフィックスを翻訳し、将来のコンテキストを利用する方法を学習できます。


Simultaneous machine translation, which aims at a real-time translation, is useful in many live scenarios but very challenging due to the trade-off between accuracy and latency. To achieve the balance for both, the model needs to wait for appropriate streaming text (READ policy) and then generates its translation (WRITE policy). However, WRITE policies of previous work either are specific to the method itself due to the end-to-end training or suffer from the input mismatch between training and decoding for the non-end-to-end training. Therefore, it is essential to learn a generic and better WRITE policy for simultaneous machine translation. Inspired by strategies utilized by human interpreters and ‘wait’ policies, we propose a novel adaptive prefix-to-prefix training policy called LEAPT, which allows our machine translation model to learn how to translate source sentence prefixes and make use of the future context. Experiments show that our proposed methods greatly outperform competitive baselines and achieve promising results.


著者 Lei Lin,Shuangtao Li,Xiaodong Shi
発行日 2023-03-21 11:17:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク