Developments in Sheaf-Theoretic Models of Natural Language Ambiguities

要約

層は、位相空間を構成する基底と、その各開集合に関連付けられたデータから構成される数学的オブジェクトです。
開集合上で定義された連続関数。
層はもともと代数トポロジーと論理で使用されてきました。
最近では、物理実験や自然言語の曖昧さ回避プロセスなどのイベントもモデル化しています。
我々は後者のモデルを語彙の曖昧さから照応から生じる談話の曖昧さまで拡張します。
まず、基本的な照応的談話のデータセットの文脈性の新しい尺度を計算しました。その結果、文脈モデルが 3.17% しか得られなかった以前の研究と比較して、文脈モデルの割合が 82.9% 増加しました。
次に、照応曖昧性を伴う Winograd スキーマとして知られる自然言語処理の課題の拡張を、文脈比率 0.096 の Bell-CHSH シナリオでどのようにモデル化できるかを示します。

要約(オリジナル)

Sheaves are mathematical objects consisting of a base which constitutes a topological space and the data associated with each open set thereof, e.g. continuous functions defined on the open sets. Sheaves have originally been used in algebraic topology and logic. Recently, they have also modelled events such as physical experiments and natural language disambiguation processes. We extend the latter models from lexical ambiguities to discourse ambiguities arising from anaphora. To begin, we calculated a new measure of contextuality for a dataset of basic anaphoric discourses, resulting in a higher proportion of contextual models-82.9%-compared to previous work which only yielded 3.17% contextual models. Then, we show how an extension of the natural language processing challenge, known as the Winograd Schema, which involves anaphoric ambiguities can be modelled on the Bell-CHSH scenario with a contextual fraction of 0.096.

arxiv情報

著者 Kin Ian Lo,Mehrnoosh Sadrzadeh,Shane Mansfield
発行日 2024-10-01 09:54:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, quant-ph パーマリンク