Measuring Sentiment Bias in Machine Translation

要約

生成モデルによってテキストに引き起こされるバイアスは、近年ますます大きな話題になっています。
この論文では、感情分析モデルによって分類された感情に機械翻訳がどのようにバイアスをもたらす可能性があるかを調査します。
このため、2 つの並列コーパス上で 5 つの異なる言語に対する 3 つのオープン アクセス機械翻訳モデルを比較し、翻訳プロセスによってテキスト内で認識されるセンチメント クラスの変化が生じるかどうかをテストします。
私たちの統計テストはラベル確率分布の変化を示していますが、翻訳プロセスによって引き起こされたバイアスを仮定するのに十分な一貫性があるように見えるものは見つかりませんでした。

要約(オリジナル)

Biases induced to text by generative models have become an increasingly large topic in recent years. In this paper we explore how machine translation might introduce a bias in sentiments as classified by sentiment analysis models. For this, we compare three open access machine translation models for five different languages on two parallel corpora to test if the translation process causes a shift in sentiment classes recognized in the texts. Though our statistic test indicate shifts in the label probability distributions, we find none that appears consistent enough to assume a bias induced by the translation process.

arxiv情報

著者 Kai Hartung,Aaricia Herygers,Shubham Kurlekar,Khabbab Zakaria,Taylan Volkan,Sören Gröttrup,Munir Georges
発行日 2023-06-12 14:40:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク