Negative Lexical Constraints in Neural Machine Translation

要約

この論文では、英語からチェコ語へのニューラル機械翻訳における否定的な語彙制約について調査します。
負の語彙制約は、ニューラル翻訳モデルによって生成される翻訳で特定の単語や表現を禁止するために使用されます。
デコードプロセスまたはトレーニングデータのいずれかの変更に基づいて、さまざまな方法を比較しました。
比較は、言い換えとフィードバックに基づく翻訳の改良という 2 つのタスクで実行されました。
また、これらの手法が、特定の制約の異なる表面形式を生成することによって、モデルに提示された制約 (通常は辞書形式) をどの程度「回避」するかについても調査しました。
制約を回避する可能性がある、単語のさまざまな表層形式を誘導するモデルの能力に対抗します。
多くの場合、問題は依然として残りますが、私たちの方法で制約が改善されることを示します。

要約(オリジナル)

This paper explores negative lexical constraining in English to Czech neural machine translation. Negative lexical constraining is used to prohibit certain words or expressions in the translation produced by the neural translation model. We compared various methods based on modifying either the decoding process or the training data. The comparison was performed on two tasks: paraphrasing and feedback-based translation refinement. We also studied to which extent these methods ‘evade’ the constraints presented to the model (usually in the dictionary form) by generating a different surface form of a given constraint.We propose a way to mitigate the issue through training with stemmed negative constraints to counter the model’s ability to induce a variety of the surface forms of a word that can result in bypassing the constraint. We demonstrate that our method improves the constraining, although the problem still persists in many cases.

arxiv情報

著者 Josef Jon,Dušan Variš,Michal Novák,João Paulo Aires,Ondřej Bojar
発行日 2023-08-07 14:04:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク