A Language-agnostic Model of Child Language Acquisition

要約

この研究では、もともと英語用に設計された最近のセマンティック ブートストラッピング子言語習得モデルを再実装し、新しい言語であるヘブライ語を学習するようにトレーニングします。
このモデルは、発話のペアと論理形式を意味表現として学習し、構文と単語の意味の両方を同時に取得します。
結果は、モデルはほとんどヘブライ語に移行しますが、ヘブライ語の形態が豊富であることを含む多くの要因により、学習が遅くなり、堅牢性が低下することが示されています。
これは、将来の研究の明確な方向性が、異なる語形間の類似性をモデルで活用できるようにすることであることを示唆しています。

要約(オリジナル)

This work reimplements a recent semantic bootstrapping child-language acquisition model, which was originally designed for English, and trains it to learn a new language: Hebrew. The model learns from pairs of utterances and logical forms as meaning representations, and acquires both syntax and word meanings simultaneously. The results show that the model mostly transfers to Hebrew, but that a number of factors, including the richer morphology in Hebrew, makes the learning slower and less robust. This suggests that a clear direction for future work is to enable the model to leverage the similarities between different word forms.

arxiv情報

著者 Louis Mahon,Omri Abend,Uri Berger,Katherine Demuth,Mark Johnson,Mark Steedman
発行日 2024-08-22 09:48:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク