Charles Translator: A Machine Translation System between Ukrainian and Czech

要約

私たちは、ロシア・ウクライナ戦争が個人と社会に及ぼす影響を軽減するための社会全体の取り組みの一環として開発された、ウクライナ語とチェコ語間の機械翻訳システム、Charles Translator を紹介します。
このシステムは、当時必要な品質で利用できなかったこのようなサービスの需要に迅速に応えるために、多くの言語データ プロバイダーの協力を得て 2022 年の春に開発されました。
この翻訳者は後にオンライン Web インターフェイスとして、また音声入力を備えた Android アプリとして実装され、どちらもキリル文字とラテン文字の音訳を備えていました。
英語を軸として使用する他の利用可能なシステムと比較して、このシステムは直接翻訳するため、2 つの言語の類型的類似性を利用できます。
ブロック逆変換方式を使用しているため、単一言語のトレーニング データを効率的に使用できます。
この文書では、データの収集と実装、評価を含む開発プロセスについて説明し、いくつかの使用例に言及し、教育目的でのシステムのさらなる開発の可能性について概説します。

要約(オリジナル)

We present Charles Translator, a machine translation system between Ukrainian and Czech, developed as part of a society-wide effort to mitigate the impact of the Russian-Ukrainian war on individuals and society. The system was developed in the spring of 2022 with the help of many language data providers in order to quickly meet the demand for such a service, which was not available at the time in the required quality. The translator was later implemented as an online web interface and as an Android app with speech input, both featuring Cyrillic-Latin script transliteration. The system translates directly, compared to other available systems that use English as a pivot, and thus take advantage of the typological similarity of the two languages. It uses the block back-translation method, which allows for efficient use of monolingual training data. The paper describes the development process, including data collection and implementation, evaluation, mentions several use cases, and outlines possibilities for the further development of the system for educational purposes.

arxiv情報

著者 Martin Popel,Lucie Poláková,Michal Novák,Jindřich Helcl,Jindřich Libovický,Pavel Straňák,Tomáš Krabač,Jaroslava Hlaváčová,Mariia Anisimova,Tereza Chlaňová
発行日 2024-04-10 12:22:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク