Emergence of a phonological bias in ChatGPT

要約

OpenAI の ChatGPT などの現在の大規模な言語モデルは、言語の使用において非常に優れているため、世間の注目を集めています。
ここでは、ChatGPT が人間の言語処理の特徴である音韻バイアスを示していることを示します。
より具体的に言うと、人間と同じように、ChatGPT にも子音バイアスがあります。
つまり、チャットボットは単語を識別するために母音ではなく子音を使用する傾向があります。
これは、英語やスペイン語など、子音と母音の相対的な分布が異なる言語間で観察されます。
現在の人工知能言語モデルが言語刺激を処理するようにトレーニングされる方法と人間の幼児が言語を獲得する方法には違いがあるにもかかわらず、ChatGPT における音韻バイアスの出現にはそのようなトレーニングで十分であると考えられます。

要約(オリジナル)

Current large language models, such as OpenAI’s ChatGPT, have captured the public’s attention because how remarkable they are in the use of language. Here, I demonstrate that ChatGPT displays phonological biases that are a hallmark of human language processing. More concretely, just like humans, ChatGPT has a consonant bias. That is, the chatbot has a tendency to use consonants over vowels to identify words. This is observed across languages that differ in their relative distribution of consonants and vowels such as English and Spanish. Despite the differences in how current artificial intelligence language models are trained to process linguistic stimuli and how human infants acquire language, such training seems to be enough for the emergence of a phonological bias in ChatGPT

arxiv情報

著者 Juan Manuel Toro
発行日 2023-05-25 10:57:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク