要約
人間の言語は、意味を伝えることを目的としていますが、本質的に曖昧さを伴います。
これは音声および言語処理に課題をもたらしますが、重要なコミュニケーション機能も果たします。
曖昧さを効率的に解決することは、望ましい特性であると同時に必要な特性でもあります。
文脈内の単語の語彙的意味は、英語に限定され偏った外部知識に依存する Word Sense Disambiguation (WSD) アルゴリズムによって自動的に判断できます。
コンテンツを他の言語に適応させる場合、自動翻訳は不正確であることが多く、正確さと理解を確保するには高度な専門家による人間による検証が必要です。
現在の研究では、スペイン語 WSD の新しいリソースを導入することで、以前の制限に対処しています。
これには、Real Academia Espa\~nola によって維持されている Diccionario de la Lengua Espa\~nola から供給されたセンス インベントリと語彙データセットが含まれています。
また、スペイン語の現在のリソースを確認し、最先端のシステムによってそれらの指標をレポートします。
要約(オリジナル)
Human language, while aimed at conveying meaning, inherently carries ambiguity. It poses challenges for speech and language processing, but also serves crucial communicative functions. Efficiently solve ambiguity is both a desired and a necessary characteristic. The lexical meaning of a word in context can be determined automatically by Word Sense Disambiguation (WSD) algorithms that rely on external knowledge often limited and biased toward English. When adapting content to other languages, automated translations are frequently inaccurate and a high degree of expert human validation is necessary to ensure both accuracy and understanding. The current study addresses previous limitations by introducing a new resource for Spanish WSD. It includes a sense inventory and a lexical dataset sourced from the Diccionario de la Lengua Espa\~nola which is maintained by the Real Academia Espa\~nola. We also review current resources for Spanish and report metrics on them by a state-of-the-art system.
arxiv情報
著者 | Pablo Ortega,Jordi Luque,Luis Lamiable,Rodrigo López,Richard Benjamins |
発行日 | 2024-09-30 17:22:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google