Cross-lingual, Character-Level Neural Morphological Tagging

要約

一般的なNLPタスクであっても、多くの言語で十分な監督は利用できません。形態学的タグ付けも例外ではありません。
ここで紹介した作業では、転送学習スキームを探ります。これにより、キャラクターレベルの再発性神経タガーを訓練して、高リソース言語と低リソース言語の形態学的タギングを予測します。
複数の関連言語間の共同文字表現を学習することで、高リソース言語から低リソースの言語への知識の転送がうまくいくことができ、単一言語モデルで最大30%の精度を向上させます。

要約(オリジナル)

Even for common NLP tasks, sufficient supervision is not available in many languages — morphological tagging is no exception. In the work presented here, we explore a transfer learning scheme, whereby we train character-level recurrent neural taggers to predict morphological taggings for high-resource languages and low-resource languages together. Learning joint character representations among multiple related languages successfully enables knowledge transfer from the high-resource languages to the low-resource ones, improving accuracy by up to 30% over a monolingual model.

arxiv情報

著者 Ryan Cotterell,Georg Heigold
発行日 2025-04-24 06:20:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク