Morphological Inflection with Phonological Features

要約

近年、形態学的タスクの解決に大きな進歩がもたらされましたが、これは主に、屈折 (再) や解析としてさまざまなタスクに適用された強力なニューラル モデルによるものです。
しかし、そのような形態学的タスクは、特に利用可能な訓練データがほとんどない場合、またはこれまでに見たことのない補題に一般化する場合には、解決されたとはみなされません。
この研究では、形態学的プロセスのターゲットであるサブキャラクターの音韻的特徴に形態学的モデルがアクセスするさまざまな方法を通じて得られるパフォーマンスへの影響を調査します。
この目標を達成するために 2 つの方法を設計します。1 つはモデルをそのままにしてデータを操作して文字の代わりに特徴を含める方法で、もう 1 つは音素の表現を構築するときに音韻特徴を考慮に入れるようにモデルを操作する方法です。
私たちは、書記素から音素へのマッピングが浅い言語の言語固有の文法を使用して、標準的な書記データから音素データを抽出し、8 つの言語にわたって 2 つの再屈折モデルを実験します。
私たちの結果は、私たちの方法が、一部の言語で若干の改善を加えたものの、全体としては書記素ベースのベースラインと同等の結果をもたらすことを示しています。
全体として、我々は、音素が明示的に表現されていない場合でも、文字分布のパターンにより、モデルが根底にある音韻特性を推測できる可能性が高いと結論付けています。

要約(オリジナル)

Recent years have brought great advances into solving morphological tasks, mostly due to powerful neural models applied to various tasks as (re)inflection and analysis. Yet, such morphological tasks cannot be considered solved, especially when little training data is available or when generalizing to previously unseen lemmas. This work explores effects on performance obtained through various ways in which morphological models get access to subcharacter phonological features that are the targets of morphological processes. We design two methods to achieve this goal: one that leaves models as is but manipulates the data to include features instead of characters, and another that manipulates models to take phonological features into account when building representations for phonemes. We elicit phonemic data from standard graphemic data using language-specific grammars for languages with shallow grapheme-to-phoneme mapping, and we experiment with two reinflection models over eight languages. Our results show that our methods yield comparable results to the grapheme-based baseline overall, with minor improvements in some of the languages. All in all, we conclude that patterns in character distributions are likely to allow models to infer the underlying phonological characteristics, even when phonemes are not explicitly represented.

arxiv情報

著者 David Guriel,Omer Goldman,Reut Tsarfaty
発行日 2023-06-21 21:34:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク