要約
本論文では、Lambek Calculusのカテゴリ的構成分布意味論を、縮約規則と順列規則の限定版であるRelevant Modality !L*とともに開発する。意味論のカテゴリカルな部分は、微分カテゴリーの構造に非常によく似た、コルゲートモダリティを持つモノイダルバイクローズドカテゴリーである。このカテゴリーを「量子化」ファンクターを介して有限次元ベクトル空間と線形写像にインスタンス化し、コルゲブラモダリティの3つの具体的な解釈を用いて研究を行う。L*の動機となる例、すなわち寄生ギャップを持つフレーズの導出について、カテゴリー的かつ具体的な意味解釈を構築するために、このモデルを適用する。具体的解釈の有効性は、BERT、Word2Vec、FastTextのベクトルと関係テンソルを用いて、文の曖昧性解消データセットを寄生虫ギャップのあるフレーズに拡張した曖昧性解消タスクで評価される。
要約(オリジナル)
We develop a categorical compositional distributional semantics for Lambek Calculus with a Relevant Modality !L*, which has a limited edition of the contraction and permutation rules. The categorical part of the semantics is a monoidal biclosed category with a coalgebra modality, very similar to the structure of a Differential Category. We instantiate this category to finite dimensional vector spaces and linear maps via ‘quantisation’ functors and work with three concrete interpretations of the coalgebra modality. We apply the model to construct categorical and concrete semantic interpretations for the motivating example of !L*: the derivation of a phrase with a parasitic gap. The effectiveness of the concrete interpretations are evaluated via a disambiguation task, on an extension of a sentence disambiguation dataset to parasitic gap phrases, using BERT, Word2Vec, and FastText vectors and Relational tensors.
arxiv情報
著者 | Lachlan McPheat,Mehrnoosh Sadrzadeh,Hadi Wazni,Gijs Wijnholds |
発行日 | 2023-05-11 14:55:08+00:00 |
arxivサイト | arxiv_id(pdf) |