The formation of perceptual space in early phonetic acquisition: a cross-linguistic modeling approach

要約

この研究では、2 つの重要な側面で以前の研究を進めることにより、学習者が初期の音声習得においてどのように知覚空間を組織化するかを調査します。
まず、学習された隠れた表現の形状と、音声カテゴリを分類する能力を調べます。
第二に、言語学習の初期段階を厳密に模倣し、文脈上の手がかりを含まない、文脈のない音響情報に対するトレーニング モデルの音声習得への影響を調査します。
クロス言語モデリング アプローチを使用して、オートエンコーダー モデルは英語と北京語でトレーニングされ、幼児の言語知覚研究で使用される実験条件に従って、ネイティブ条件と非ネイティブ条件の両方で評価されます。
この結果は、文脈自由音響情報に関する教師なしボトムアップトレーニングが、英語と北京語の両方についてネイティブ条件と非ネイティブ条件の間の知覚空間の比較可能な学習表現につながり、幼児のユニバーサルリスニングの初期段階に似ていることを示しています。
これらの発見は、初期の音声獲得における知覚空間の組織化に関する洞察を提供し、音声カテゴリーの形成と表現の理解に貢献します。

要約(オリジナル)

This study investigates how learners organize perceptual space in early phonetic acquisition by advancing previous studies in two key aspects. Firstly, it examines the shape of the learned hidden representation as well as its ability to categorize phonetic categories. Secondly, it explores the impact of training models on context-free acoustic information, without involving contextual cues, on phonetic acquisition, closely mimicking the early language learning stage. Using a cross-linguistic modeling approach, autoencoder models are trained on English and Mandarin and evaluated in both native and non-native conditions, following experimental conditions used in infant language perception studies. The results demonstrate that unsupervised bottom-up training on context-free acoustic information leads to comparable learned representations of perceptual space between native and non-native conditions for both English and Mandarin, resembling the early stage of universal listening in infants. These findings provide insights into the organization of perceptual space during early phonetic acquisition and contribute to our understanding of the formation and representation of phonetic categories.

arxiv情報

著者 Frank Lihui Tan,Youngah Do
発行日 2024-07-26 04:18:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS, I.2.7 パーマリンク