Evaluation of Automatically Constructed Word Meaning Explanations

要約

正確で包括的な単語の意味の説明を準備することは、単一言語辞書作成のプロセスにおける重要なステップの 1 つです。
標準的な方法論では、説明には専門の辞書編集者が必要であり、説明テキストとコーパスの証拠との間の一貫性をチェックするためにかなりの時間を費やします。
以下のテキストでは、非常に大規模なコーパス、特に単語のスケッチから収集された情報に基づいて、自動的に説明を導き出す新しいツールを紹介します。
また、名詞の説明に焦点を当てて、構成された説明の定量的評価を提案します。
この方法論は、ある程度言語に依存しません。
ただし、提示された検証はチェコ語と英語に限定されます。
提示されたアプローチにより、約 90% のケースで単語の意味を理解するのに役立つデータを含む説明を作成できることを示します。
ただし、多くの場合、冗長な情報を削除するために結果を編集する必要があります。

要約(オリジナル)

Preparing exact and comprehensive word meaning explanations is one of the key steps in the process of monolingual dictionary writing. In standard methodology, the explanations need an expert lexicographer who spends a substantial amount of time checking the consistency between the descriptive text and corpus evidence. In the following text, we present a new tool that derives explanations automatically based on collective information from very large corpora, particularly on word sketches. We also propose a quantitative evaluation of the constructed explanations, concentrating on explanations of nouns. The methodology is to a certain extent language independent; however, the presented verification is limited to Czech and English. We show that the presented approach allows to create explanations that contain data useful for understanding the word meaning in approximately 90% of cases. However, in many cases, the result requires post-editing to remove redundant information.

arxiv情報

著者 Marie Stará,Pavel Rychlý,Aleš Horák
発行日 2023-02-27 09:47:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク