Do language models capture implied discourse meanings? An investigation with exhaustivity implicatures of Korean morphology

要約

自然言語における有マーク性は、多くの場合、談話における非文字通りの意味と関連付けられます。
韓国語の差分オブジェクトマーキング (DOM) はこの現象の一例であり、名詞句の意味論的特徴と、意味論的特徴に直交する談話特徴の両方に基づいて後位置マーカーが選択されます。
これまでの研究では、言語の分布モデルが単語の特定の意味論的特徴を回復することが示されていますが、これらのモデルは暗黙の談話レベルの意味も同様に捉えているのでしょうか?
私たちは、一連の大規模な言語モデルが談話の意味を韓国語のさまざまなオブジェクト記号と関連付けることができるかどうかを評価します。
結果は、文法マーカーの談話の意味は、談話マーカーの意味よりもエンコードが難しい可能性があることを示唆しています。

要約(オリジナル)

Markedness in natural language is often associated with non-literal meanings in discourse. Differential Object Marking (DOM) in Korean is one instance of this phenomenon, where post-positional markers are selected based on both the semantic features of the noun phrases and the discourse features that are orthogonal to the semantic features. Previous work has shown that distributional models of language recover certain semantic features of words — do these models capture implied discourse-level meanings as well? We evaluate whether a set of large language models are capable of associating discourse meanings with different object markings in Korean. Results suggest that discourse meanings of a grammatical marker can be more challenging to encode than that of a discourse marker.

arxiv情報

著者 Hagyeong Shin,Sean Trott
発行日 2024-05-15 12:34:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク