Coarse-Grained Sense Inventories Based on Semantic Matching between English Dictionaries

要約

WordNet は、意味上の関係を通じて単語のつながりを視覚化する、手作りされた最大の概念辞書の 1 つです。
これは、自然言語処理タスクにおける語感の一覧表として広く使用されています。
しかし、WordNet のきめ細かい感覚は、使いやすさを制限するという批判を受けてきました。
この論文では、ケンブリッジ辞書と WordNet の意味定義を意味的に照合し、新しい粗粒な意味インベントリを開発します。
インベントリの意味的一貫性を粗感覚インベントリの意味的一貫性と比較することで、インベントリの有効性を検証します。
提案されたインベントリの利点には、大規模リソースへの依存度が低いこと、密接に関連する感覚のより適切な集約、CEFR レベルの割り当て、拡張と改善の容易さが含まれます。

要約(オリジナル)

WordNet is one of the largest handcrafted concept dictionaries visualizing word connections through semantic relationships. It is widely used as a word sense inventory in natural language processing tasks. However, WordNet’s fine-grained senses have been criticized for limiting its usability. In this paper, we semantically match sense definitions from Cambridge dictionaries and WordNet and develop new coarse-grained sense inventories. We verify the effectiveness of our inventories by comparing their semantic coherences with that of Coarse Sense Inventory. The advantages of the proposed inventories include their low dependency on large-scale resources, better aggregation of closely related senses, CEFR-level assignments, and ease of expansion and improvement.

arxiv情報

著者 Masato Kikuchi,Masatsugu Ono,Toshioki Soga,Tetsu Tanabe,Tadachika Ozono
発行日 2024-09-10 10:08:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク