要約
NMTの新たな研究方向には、人間の判断との高い相関関係を実証し、品質を認識したデコードを通じて翻訳を強化することができる品質推定(QE)モデルの使用が含まれます。
複数の候補翻訳のサンプリングに基づいていくつかのアプローチが提案されていますが、これらのモデルをデコードプロセスに直接統合するものはありません。
この論文では、これに対処し、部分的な翻訳を確実に獲得できる新しいトークンレベルのQEモデルを提案します。
デコーダーモデルは本質的に訓練され、部分的なシーケンスで効率的であるため、このための一方向のQEモデルを構築します。
次に、品質認識デコードのQEモデルを統合するデコード戦略を提示し、最先端のQEモデル(最大$ 1.39 $ XCOMET–UST-ART QEモデルと再ランク付けするN-BESTリストと比較すると、翻訳品質が改善することを示します。
xxl $ \ uparrow $)。
最後に、私たちのアプローチは、n-bestリストの品質が一般的に準最適であるドキュメント翻訳タスクに大きな利点を提供することを示します。
要約(オリジナル)
An emerging research direction in NMT involves the use of Quality Estimation (QE) models, which have demonstrated high correlations with human judgment and can enhance translations through Quality-Aware Decoding. Although several approaches have been proposed based on sampling multiple candidate translations, none have integrated these models directly into the decoding process. In this paper, we address this by proposing a novel token-level QE model capable of reliably scoring partial translations. We build a uni-directional QE model for this, as decoder models are inherently trained and efficient on partial sequences. We then present a decoding strategy that integrates the QE model for Quality-Aware decoding and demonstrate that the translation quality improves when compared to the N-best list re-ranking with state-of-the-art QE models (upto $1.39$ XCOMET-XXL $\uparrow$). Finally, we show that our approach provides significant benefits in document translation tasks, where the quality of N-best lists is typically suboptimal.
arxiv情報
著者 | Sai Koneru,Matthias Huck,Miriam Exel,Jan Niehues |
発行日 | 2025-02-12 16:49:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google