Spatio-Temporal Graph Neural Networks for Infant Language Acquisition Prediction

要約

子供が次に学ぶという言葉を予測することは、言語の習得を強化するのに役立つ可能性があり、そのような予測は両方のニューラルネットワーク技術(時間の経過に伴う語彙状態の変化を見る)とグラフモデル(単語間の関係に関するデータを見る)で可能であることが示されています。
ただし、これらのモデルは、単独で使用された場合、乳児の言語学習プロセスの複雑さを完全に捉えていません。
この論文では、幼児および幼児の言語習得のモデルを、児童言語学習中に発生するさまざまなタイプの言語関係を考慮して、時空間グラフ畳み込みネットワーク(STGCN)で使用するために構築および適応できる方法を調べます。
子どもの語彙の獲得を予測するための新しいアプローチを導入し、言語習得中に発生するさまざまなタイプの言語関係に関するそのようなモデルの有効性を評価し、モデルのキャリブレーションとノルム選択に関する洞察に富んだ観察をもたらします。
このモデルの評価では、感覚運動関係(0.733)とセマンティック関係(0.729)を使用する際の新しい単語を予測するためのモデルの平均精度(0.729)は、2層のフィードフォワードニューラルネットワークで観察されたものよりも優れていることがわかったことがわかりました。
さらに、一部の関係の高いリコールは、一部の関係(視覚)が他の関係(聴覚など)よりもその後学習すべき関連する単語のより大きな割合を特定する上で優れていることを示唆しました。

要約(オリジナル)

Predicting the words that a child is going to learn next can be useful for boosting language acquisition, and such predictions have been shown to be possible with both neural network techniques (looking at changes in the vocabulary state over time) and graph model (looking at data pertaining to the relationships between words). However, these models do not fully capture the complexity of the language learning process of an infant when used in isolation. In this paper, we examine how a model of language acquisition for infants and young children can be constructed and adapted for use in a Spatio-Temporal Graph Convolutional Network (STGCN), taking into account the different types of linguistic relationships that occur during child language learning. We introduce a novel approach for predicting child vocabulary acquisition, and evaluate the efficacy of such a model with respect to the different types of linguistic relationships that occur during language acquisition, resulting in insightful observations on model calibration and norm selection. An evaluation of this model found that the mean accuracy of models for predicting new words when using sensorimotor relationships (0.733) and semantic relationships (0.729) were found to be superior to that observed with a 2-layer Feed-forward neural network. Furthermore, the high recall for some relationships suggested that some relationships (e.g. visual) were superior in identifying a larger proportion of relevant words that a child should subsequently learn than others (such as auditory).

arxiv情報

著者 Andrew Roxburgh,Floriana Grasso,Terry R. Payne
発行日 2025-03-18 15:21:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク