SLANG: New Concept Comprehension of Large Language Models

要約

言語の動的な性質は、特にインターネット上のスラングやミームの領域で顕著であり、大規模言語モデル(LLM)の適応性に深刻な課題を投げかけている。伝統的に静的なデータセットに固定されているこれらのモデルは、オンラインコミュニティに特徴的な急速な言語進化についていけないことが多い。本研究では、継続的な再トレーニングに高いコストをかけることなく、インターネット上で進化する新しい概念に対するLLMの理解力を高めることで、このギャップを埋めることを目指す。この目標を達成するために、LLMが新しい概念を理解する能力を評価するために、自律的に新しいデータを統合してデータセットを最新に保つことができる新しいベンチマーク$textbf{SLANG}$と、LLMが新しいフレーズとその口語的文脈を理解する能力を強化するために因果推論を使用するアプローチ$textbf{FOCUS}$を提案する。私たちのベンチマークとアプローチは、文脈的ビーコンとして機能する言語的シフトの実例を消化することで、新しく出現した表現とその意味の間に、より正確で文脈に関連したつながりを形成する。実証分析の結果、我々の因果推論に基づくアプローチは、インターネットスラングやミームの理解において、精度と関連性の点で従来のモデルを凌駕することが示された。

要約(オリジナル)

The dynamic nature of language, particularly evident in the realm of slang and memes on the Internet, poses serious challenges to the adaptability of large language models (LLMs). Traditionally anchored to static datasets, these models often struggle to keep up with the rapid linguistic evolution characteristic of online communities. This research aims to bridge this gap by enhancing LLMs’ comprehension of the evolving new concepts on the Internet, without the high cost of continual retraining. In pursuit of this goal, we propose a new benchmark $\textbf{SLANG}$, which can autonomously integrates novel data to stay dataset up-to-date, to assess LLMs’ capability in comprehending emerging concepts and an approach $\textbf{FOCUS}$, which uses causal inference to enhance LLMs to understand new phrases and their colloquial context. Our benchmark and approach involves digesting real-world instances of linguistic shifts, serving as contextual beacons, to form more precise and contextually relevant connections between newly emerging expressions and their meanings. The empirical analysis shows that our causal inference-based approach outperforms the traditional models in terms of precision and relevance in the comprehension of Internet slang and memes.

arxiv情報

著者 Lingrui Mei,Shenghua Liu,Yiwei Wang,Baolong Bi,Xueqi Cheng
発行日 2024-02-05 17:49:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク