要約
同時機械翻訳 (SiMT) は、原文を読みながらターゲットの翻訳を生成します。
ポリシーに基づいて、文章を読み取って翻訳を生成する最適なタイミングを決定します。
既存の SiMT 手法は一般に、ポリシーの決定と変換の生成を同時に行う従来の Transformer アーキテクチャを採用しています。
ポリシーの決定には優れていますが、翻訳パフォーマンスは最適とは言えません。
逆に、広範なコーパスで訓練された大規模言語モデル (LLM) は優れた生成能力を備えていますが、SiMT の訓練方法では翻訳ポリシーを獲得することが困難です。
そこで、LLM と従来の SiMT 手法の長所を組み合わせたフレームワークである Agent-SiMT を紹介します。
Agent-SiMT には、ポリシー決定エージェントと変換エージェントが含まれます。
ポリシー決定エージェントは SiMT モデルによって管理され、部分的な原文と翻訳を使用して翻訳ポリシーを決定します。
翻訳エージェントは、LLM を利用して、部分的な原文に基づいて翻訳を生成します。
2 つのエージェントは協力して SiMT を実行します。
実験により、Agent-SiMT が最先端のパフォーマンスを達成することが実証されました。
要約(オリジナル)
Simultaneous Machine Translation (SiMT) generates target translations while reading the source sentence. It relies on a policy to determine the optimal timing for reading sentences and generating translations. Existing SiMT methods generally adopt the traditional Transformer architecture, which concurrently determines the policy and generates translations. While they excel at determining policies, their translation performance is suboptimal. Conversely, Large Language Models (LLMs), trained on extensive corpora, possess superior generation capabilities, but it is difficult for them to acquire translation policy through the training methods of SiMT. Therefore, we introduce Agent-SiMT, a framework combining the strengths of LLMs and traditional SiMT methods. Agent-SiMT contains the policy-decision agent and the translation agent. The policy-decision agent is managed by a SiMT model, which determines the translation policy using partial source sentence and translation. The translation agent, leveraging an LLM, generates translation based on the partial source sentence. The two agents collaborate to accomplish SiMT. Experiments demonstrate that Agent-SiMT attains state-of-the-art performance.
arxiv情報
著者 | Shoutao Guo,Shaolei Zhang,Zhengrui Ma,Min Zhang,Yang Feng |
発行日 | 2024-06-12 15:05:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google