Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation

要約

このプロジェクトでは、インドネシア語から英語へのマンファ翻訳を自動化するための実用的で効率的なソリューションを開発する。我々のアプローチは、コンピュータ・ビジョン、テキスト認識、自然言語処理技術を組み合わせ、従来手作業で行われていたマンファ(韓国語コミック)の翻訳プロセスを合理化する。このパイプラインには、吹き出し検出用に微調整されたYOLOv5xu、OCR用に微調整されたTesseract、機械翻訳用に微調整されたMarianMTが含まれる。これらのステップを自動化することで、手作業による翻訳と比較して時間と労力を節約しながら、世界中の読者がマンファにアクセスしやすくなることを目指しています。多くのManhwa翻訳が日本語から英語への翻訳に焦点を当てているのに対し、私たちはインドネシア語から英語への翻訳に焦点を当て、低リソース言語での作業の課題に取り組みます。私たちのモデルは、各ステップで良好な結果を示し、インドネシア語から英語への翻訳を効率的に行うことができました。

要約(オリジナル)

In this project, we develop a practical and efficient solution for automating the Manhwa translation from Indonesian to English. Our approach combines computer vision, text recognition, and natural language processing techniques to streamline the traditionally manual process of Manhwa(Korean comics) translation. The pipeline includes fine-tuned YOLOv5xu for speech bubble detection, Tesseract for OCR and fine-tuned MarianMT for machine translation. By automating these steps, we aim to make Manhwa more accessible to a global audience while saving time and effort compared to manual translation methods. While most Manhwa translation efforts focus on Japanese-to-English, we focus on Indonesian-to-English translation to address the challenges of working with low-resource languages. Our model shows good results at each step and was able to translate from Indonesian to English efficiently.

arxiv情報

著者 Nithyasri Narasimhan,Sagarika Singh
発行日 2025-01-03 04:32:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.CV, cs.LG パーマリンク