Context-Aware Semantic Similarity Measurement for Unsupervised Word Sense Disambiguation

要約

語感の曖昧さの問題は、この課題に対処するために機械学習モデルに供給する注釈付きデータが不足しているため、自然言語処理において重大な課題を引き起こしています。
したがって、注釈付きデータに依存せずにその課題を克服するために、教師なしの語義曖昧さ回避方法が開発されました。
この研究は、教師なし語義曖昧さ除去に対する新しい文脈認識アプローチを提案します。これは、類似性測定プロセスに文脈情報を組み込むための柔軟なメカニズムを提供します。
私たちは、提案された戦略を評価するために一般的なベンチマーク データセットを実験し、そのパフォーマンスを最先端の教師なし語義曖昧さ回避技術と比較します。
実験結果は、私たちのアプローチが曖昧さ回避の精度を大幅に向上させ、いくつかの既存の手法のパフォーマンスを上回ることを示しています。
私たちの発見は、教師なしシナリオにおける語義の曖昧さを効果的に管理するために、意味的類似性の測定に文脈情報を統合することの重要性を強調しています。

要約(オリジナル)

The issue of word sense ambiguity poses a significant challenge in natural language processing due to the scarcity of annotated data to feed machine learning models to face the challenge. Therefore, unsupervised word sense disambiguation methods have been developed to overcome that challenge without relying on annotated data. This research proposes a new context-aware approach to unsupervised word sense disambiguation, which provides a flexible mechanism for incorporating contextual information into the similarity measurement process. We experiment with a popular benchmark dataset to evaluate the proposed strategy and compare its performance with state-of-the-art unsupervised word sense disambiguation techniques. The experimental results indicate that our approach substantially enhances disambiguation accuracy and surpasses the performance of several existing techniques. Our findings underscore the significance of integrating contextual information in semantic similarity measurements to manage word sense ambiguity in unsupervised scenarios effectively.

arxiv情報

著者 Jorge Martinez-Gil
発行日 2023-12-13 07:13:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク