要約
この研究では、アイルランドへの大規模な言語モデル(LLM)翻訳の幻覚を調べています。特に、モデルが新しい、存在しない単語を生成する例に焦点を当てています。
これらの幻覚を動詞および名詞カテゴリ内で分類し、後者の間で6つの異なるパターンを特定します。
さらに、これらの幻覚がアイルランドの形態学的ルールと、彼らが示す言語的傾向を順守するかどうかを分析します。
私たちの調査結果は、GPT-4.OとGPT-4.Oの両方が同様のタイプの幻覚を生成しますが、ミニモデルはそれらを非常に高い頻度で生成することを示しています。
分類を超えて、議論はアイルランド語に対するこれらの幻覚の意味についての投機的な質問を提起します。
決定的な答えを求めるのではなく、LLMの使用の増加と、アイルランドの語彙と言語の進化を形作る上での潜在的な役割に関して、思考のために食物を提供します。
私たちは、特に低リソースの形態学的に豊富な言語の文脈において、そのような技術が時間の経過とともに言語にどのように影響するかについて議論することを促すことを目指しています。
要約(オリジナル)
This study examines hallucinations in Large Language Model (LLM) translations into Irish, specifically focusing on instances where the models generate novel, non-existent words. We classify these hallucinations within verb and noun categories, identifying six distinct patterns among the latter. Additionally, we analyse whether these hallucinations adhere to Irish morphological rules and what linguistic tendencies they exhibit. Our findings show that while both GPT-4.o and GPT-4.o Mini produce similar types of hallucinations, the Mini model generates them at a significantly higher frequency. Beyond classification, the discussion raises speculative questions about the implications of these hallucinations for the Irish language. Rather than seeking definitive answers, we offer food for thought regarding the increasing use of LLMs and their potential role in shaping Irish vocabulary and linguistic evolution. We aim to prompt discussion on how such technologies might influence language over time, particularly in the context of low-resource, morphologically rich languages.
arxiv情報
著者 | Sheila Castilho,Zoe Fitzsimmons,Claire Holton,Aoife Mc Donagh |
発行日 | 2025-04-10 12:08:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google