Evaluation of Chinese-English Machine Translation of Emotion-Loaded Microblog Texts: A Human Annotated Dataset for the Quality Assessment of Emotion Translation

要約

この論文では、この論文で提案されているフレームワークに従って Google 翻訳からの出力を評価することにより、現在の機械翻訳 (MT) ツールが感情を込めたテキストの翻訳をどのように実行するかに焦点を当てます。
我々は、多次元品質メトリクス (MQM) に基づいてこの評価フレームワークを提案し、MT 出力の詳細なエラー分析を実行します。
私たちの分析から、MT 出力の約 50% が元の感情を保存できていないことがわかりました。
エラーをさらに分析した結果、単語を伴う感情や、多義語、否定、略語などの言語現象が、これらの翻訳エラーの一般的な原因であることがわかりました。

要約(オリジナル)

In this paper, we focus on how current Machine Translation (MT) tools perform on the translation of emotion-loaded texts by evaluating outputs from Google Translate according to a framework proposed in this paper. We propose this evaluation framework based on the Multidimensional Quality Metrics (MQM) and perform a detailed error analysis of the MT outputs. From our analysis, we observe that about 50% of the MT outputs fail to preserve the original emotion. After further analysis of the errors, we find that emotion carrying words and linguistic phenomena such as polysemous words, negation, abbreviation etc., are common causes for these translation errors.

arxiv情報

著者 Shenbin Qian,Constantin Orasan,Felix do Carmo,Qiuliang Li,Diptesh Kanojia
発行日 2023-06-20 21:22:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク