Permutation invariant matrix statistics and computational language tasks

要約

Kartsaklis、Rangoolam、Sadrzadeh によって導入された言語行列理論プログラムは、重要な統計をエンコードする重要な観測値とみなされる順列不変多項式関数に基づいて、型駆動型の分布セマンティクスで生成される行列の統計へのアプローチです。
この論文では、組成分布意味論から生じる行列分布の近似ガウス性に関する以前の結果を一般化します。
また、順列不変量のグラフ理論的基礎と、単語に関連付けられた行列のアンサンブルの統計的特性を利用することによって定義される、単語の観察可能なベクトルの幾何学も導入します。
この統一フレームワークを、同義語、反意語、上位語、下位語の区別に関連する計算言語学の多くのタスクに適用して成功した例について説明します。

要約(オリジナル)

The Linguistic Matrix Theory programme introduced by Kartsaklis, Ramgoolam and Sadrzadeh is an approach to the statistics of matrices that are generated in type-driven distributional semantics, based on permutation invariant polynomial functions which are regarded as the key observables encoding the significant statistics. In this paper we generalize the previous results on the approximate Gaussianity of matrix distributions arising from compositional distributional semantics. We also introduce a geometry of observable vectors for words, defined by exploiting the graph-theoretic basis for the permutation invariants and the statistical characteristics of the ensemble of matrices associated with the words. We describe successful applications of this unified framework to a number of tasks in computational linguistics, associated with the distinctions between synonyms, antonyms, hypernyms and hyponyms.

arxiv情報

著者 Manuel Accettulli Huber,Adriana Correia,Sanjaye Ramgoolam,Mehrnoosh Sadrzadeh
発行日 2023-09-26 17:29:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.stat-mech, cs.CL, hep-th パーマリンク