代名詞の翻訳は、ニューラル機械翻訳 (NMT) における長年の課題であり、言語の正確さを確保するために文間のコンテキストが必要になることがよくあります。
これに対処するために、文脈認識型機械翻訳システムにおける代名詞と全体的な翻訳品質を向上させるように設計された新しいフレームワークである ProNMT を紹介します。
ProNMT は、品質推定 (QE) モデルと独自の代名詞生成尤度ベースのフィードバック メカニズムを利用して、広範な人間による注釈に依存することなく、事前トレーニングされた NMT モデルを繰り返し微調整します。
このフレームワークは、QE スコアと代名詞固有の報酬を組み合わせてトレーニングをガイドし、言語的なニュアンスの処理を向上させます。
ProNMT は、特に代名詞などのコンテキスト依存要素の翻訳において、NMT システムを改善するための効率的でスケーラブルなコンテキスト認識型のアプローチを提供します。
Pronoun translation is a longstanding challenge in neural machine translation (NMT), often requiring inter-sentential context to ensure linguistic accuracy. To address this, we introduce ProNMT, a novel framework designed to enhance pronoun and overall translation quality in context-aware machine translation systems. ProNMT leverages Quality Estimation (QE) models and a unique Pronoun Generation Likelihood-Based Feedback mechanism to iteratively fine-tune pre-trained NMT models without relying on extensive human annotations. The framework combines QE scores with pronoun-specific rewards to guide training, ensuring improved handling of linguistic nuances. Extensive experiments demonstrate significant gains in pronoun translation accuracy and general translation quality across multiple metrics. ProNMT offers an efficient, scalable, and context-aware approach to improving NMT systems, particularly in translating context-dependent elements like pronouns.
著者 | Harshit Dhankhar,Baban Gain,Asif Ekbal,Yogesh Mani Tripathi |
発行日 | 2025-01-06 13:34:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google