Hunayn: Elevating Translation Beyond the Literal

要約

このプロジェクトでは、従来のツールを超えた高度な英語からアラビア語への翻訳ツールを紹介します。
ヘルシンキ トランスフォーマー (MarianMT) を活用する私たちのアプローチには、自己スクレイピングされた純粋に文学的なアラビア語データセットの微調整が含まれます。
Google 翻訳に対する評価では、定性的評価において一貫して優れたパフォーマンスを示しています。
特に、文化的配慮と文脈の正確さにおいて優れています。
この研究は、Fusha データセットを使用した英語からアラビア語への翻訳におけるヘルシンキ変換器の優位性を強調しています。

要約(オリジナル)

This project introduces an advanced English-to-Arabic translator surpassing conventional tools. Leveraging the Helsinki transformer (MarianMT), our approach involves fine-tuning on a self-scraped, purely literary Arabic dataset. Evaluations against Google Translate show consistent outperformance in qualitative assessments. Notably, it excels in cultural sensitivity and context accuracy. This research underscores the Helsinki transformer’s superiority for English-to-Arabic translation using a Fusha dataset.

arxiv情報

著者 Nasser Almousa,Nasser Alzamil,Abdullah Alshehri,Ahmad Sait
発行日 2023-10-20 16:03:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク