A Tale of Two Laws of Semantic Change: Predicting Synonym Changes with Distributional Semantic Models

要約

語彙意味変化は、単語の意味が時間の経過とともにどのように進化するかを研究するものです。
関連するもう 1 つの質問は、同義語などの単語のペアに関する語彙関係が時間の経過とともに変化するかどうか、またどのように変化するかということです。
同義語がどのように進化するかについて、歴史的な言語学文献には現在、明らかに反対の 2 つの競合する仮説があります。微分の法則 (LD) は、同義語は時間の経過とともに異なる意味を持つ傾向があると主張するのに対し、並列変化の法則 (LPC) は次のように主張します。
同義語は同じ意味上の変化を受ける傾向があるため、同義語のままです。
これまでのところ、これらの法則が歴史的コーパスにどの程度適用されるかを評価するために分布モデルを使用した研究はほとんどありません。
この研究では、与えられた単語のペアに対して LD または LPC が機能するかどうかを検出するための最初のステップを踏みます。
問題をより扱いやすいタスクに再構成した後、2 つの言語リソースを組み合わせて、この問題に関する最初の完全な評価枠組みを提案し、LD の優位性を支持する経験的証拠を提供します。
次に、分布意味モデルを使用し、語彙意味変更検出に関する最近の文献に基づいて、この問題に対するさまざまな計算アプローチを提案します。
私たちの最良のアプローチは、データセットで 0.6 を超えるバランスのとれた精度を達成します。
多義性や同義語と上位語の間の潜在的な混同など、これらのアプローチが依然として直面している課題について説明します。

要約(オリジナル)

Lexical Semantic Change is the study of how the meaning of words evolves through time. Another related question is whether and how lexical relations over pairs of words, such as synonymy, change over time. There are currently two competing, apparently opposite hypotheses in the historical linguistic literature regarding how synonymous words evolve: the Law of Differentiation (LD) argues that synonyms tend to take on different meanings over time, whereas the Law of Parallel Change (LPC) claims that synonyms tend to undergo the same semantic change and therefore remain synonyms. So far, there has been little research using distributional models to assess to what extent these laws apply on historical corpora. In this work, we take a first step toward detecting whether LD or LPC operates for given word pairs. After recasting the problem into a more tractable task, we combine two linguistic resources to propose the first complete evaluation framework on this problem and provide empirical evidence in favor of a dominance of LD. We then propose various computational approaches to the problem using Distributional Semantic Models and grounded in recent literature on Lexical Semantic Change detection. Our best approaches achieve a balanced accuracy above 0.6 on our dataset. We discuss challenges still faced by these approaches, such as polysemy or the potential confusion between synonymy and hypernymy.

arxiv情報

著者 Bastien Liétard,Mikaela Keller,Pascal Denis
発行日 2023-05-30 15:50:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク