Word Sense Linking: Disambiguating Outside the Sandbox

要約

Word Sense Disambiguation (WSD) は、特定のコンテキスト内の単語を、一連の候補の中から最も適切な意味に関連付けることです。
このタスクは最近、アノテーター間の推定合意を超えるパフォーマンスを達成するシステムによって再び注目を集めていますが、この記事の執筆時点では、下流のアプリケーションを見つけるのにまだ苦労しています。
この背後にある理由の 1 つは、WSD をプレーン テキストに適用することの難しさであると私たちは主張します。
実際、標準的な定式化では、モデルは、a) 曖昧さを解消するすべてのスパンがすでに特定されている、および b) 各スパンの考えられるすべての候補センスが提供されているという前提の下で機能します。どちらの要件も、決して自明ではありません。
この研究では、ワード センス リンク (WSL) と呼ばれる新しいタスクを紹介します。このタスクでは、入力テキストと参照センス インベントリが与えられた場合、システムは両方とも曖昧さを解消するスパンを識別し、それらを最適な意味にリンクする必要があります。
このタスクにはトランスベースのアーキテクチャを採用し、そのパフォーマンスと WSL にスケールされた最先端の WSD システムのパフォーマンスの両方を徹底的に評価し、WSD の前提条件を繰り返し緩和します。
私たちは、私たちの取り組みによって、下流のアプリケーションへの語彙セマンティクスの統合が容易になることを願っています。

要約(オリジナル)

Word Sense Disambiguation (WSD) is the task of associating a word in a given context with its most suitable meaning among a set of possible candidates. While the task has recently witnessed renewed interest, with systems achieving performances above the estimated inter-annotator agreement, at the time of writing it still struggles to find downstream applications. We argue that one of the reasons behind this is the difficulty of applying WSD to plain text. Indeed, in the standard formulation, models work under the assumptions that a) all the spans to disambiguate have already been identified, and b) all the possible candidate senses of each span are provided, both of which are requirements that are far from trivial. In this work, we present a new task called Word Sense Linking (WSL) where, given an input text and a reference sense inventory, systems have to both identify which spans to disambiguate and then link them to their most suitable meaning.We put forward a transformer-based architecture for the task and thoroughly evaluate both its performance and those of state-of-the-art WSD systems scaled to WSL, iteratively relaxing the assumptions of WSD. We hope that our work will foster easier integration of lexical semantics into downstream applications.

arxiv情報

著者 Andrei Stefan Bejgu,Edoardo Barba,Luigi Procopio,Alberte Fernández-Castro,Roberto Navigli
発行日 2024-12-12 15:38:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク