IndoNLP 2025: Shared Task on Real-Time Reverse Transliteration for Romanized Indo-Aryan languages

要約

この論文では、インド・アーリア語のローマ字化言語のリアルタイム逆音訳に関する共有タスクの概要を説明します。
これは、インド・アーリア語族のリソースの少ない言語をネイティブ文字に逆転写することに焦点を当てています。
アドホックなトランスリテラルを使用してローマ字化されたインド・アーリア語を入力し、正確なネイティブ スクリプトを実現することは、現在のキーボード システムでは複雑で、多くの場合不正確なプロセスです。
このタスクの目的は、ローマ字化されたインド・アーリア語をネイティブ文字に変換するリアルタイム逆音訳ツールを導入して評価し、ユーザーの入力エクスペリエンスを向上させることです。
11 の登録チームのうち 4 チームが、シンハラ語、ヒンディー語、マラヤーラム語の音訳モデルを使用した最終評価フェーズに参加しました。
これらの提案されたソリューションは、アドホックな音訳の問題を解決するだけでなく、デジタル分野での低リソース言語の使いやすさを強化します。

要約(オリジナル)

The paper overviews the shared task on Real-Time Reverse Transliteration for Romanized Indo-Aryan languages. It focuses on the reverse transliteration of low-resourced languages in the Indo-Aryan family to their native scripts. Typing Romanized Indo-Aryan languages using ad-hoc transliterals and achieving accurate native scripts are complex and often inaccurate processes with the current keyboard systems. This task aims to introduce and evaluate a real-time reverse transliterator that converts Romanized Indo-Aryan languages to their native scripts, improving the typing experience for users. Out of 11 registered teams, four teams participated in the final evaluation phase with transliteration models for Sinhala, Hindi and Malayalam. These proposed solutions not only solve the issue of ad-hoc transliteration but also empower low-resource language usability in the digital arena.

arxiv情報

著者 Deshan Sumanathilaka,Isuri Anuradha,Ruvan Weerasinghe,Nicholas Micallef,Julian Hough
発行日 2025-01-10 09:41:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク