要約
機械翻訳システムは主に一般的な分野で機能するように設計されていますが、これらのシステムを文学翻訳などの他の分野に適応させる傾向が高まっています。
この論文では、英語とトルコ語の文学翻訳に焦点を当て、翻訳者の文体的特徴を考慮した機械翻訳モデルを開発します。
特定の翻訳者の手動調整作業によって、事前トレーニングされた機械翻訳モデルを微調整します。
手動および自動の位置合わせ、データ拡張方法、コーパス サイズが翻訳に及ぼす影響を詳細に分析します。
我々は、出力された翻訳における翻訳者のスタイルを評価するための、文体の特徴に基づくアプローチを提案します。
モデルを翻訳者のスタイルに適応させることで、人間の翻訳者のスタイルをターゲットの機械翻訳で高度に再現できることを示します。
要約(オリジナル)
Although machine translation systems are mostly designed to serve in the general domain, there is a growing tendency to adapt these systems to other domains like literary translation. In this paper, we focus on English-Turkish literary translation and develop machine translation models that take into account the stylistic features of translators. We fine-tune a pre-trained machine translation model by the manually-aligned works of a particular translator. We make a detailed analysis of the effects of manual and automatic alignments, data augmentation methods, and corpus size on the translations. We propose an approach based on stylistic features to evaluate the style of a translator in the output translations. We show that the human translator style can be highly recreated in the target machine translations by adapting the models to the style of the translator.
arxiv情報
著者 | Zeynep Yirmibeşoğlu,Olgun Dursun,Harun Dallı,Mehmet Şahin,Ena Hodzik,Sabri Gürses,Tunga Güngör |
発行日 | 2023-07-21 09:39:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google