To Drop or Not to Drop? Predicting Argument Ellipsis Judgments: A Case Study in Japanese

要約

話者は文中の述語の特定の引数を省略することがあります。
このような省略は、ドロップ支持言語で特に頻繁に発生します。
この研究は省略記号に関する疑問、つまりネイティブスピーカーの省略記号の決定を何が説明できるのかという問題に取り組んでいます。
— この選択に対する人間の談話処理と執筆支援への関心が動機となっています。
この目的を達成するために、私たちはまず、典型的なドロップ支持言語である日本語のバランスコーパスの 2,000 以上のデータポイントにわたって、特定の引数を省略すべきかどうか、またその理由について大規模な人による注釈を収集します。
このデータは、母語話者が全体としてそのような判断について共通の基準を共有していることを示しており、また、バランスの取れたコーパスにおける関連言語要素の分布など、母語話者の量的特徴がさらに明確になっています。
さらに、言語モデルに基づく引数省略判断モデルのパフォーマンスが検査され、特定の言語的側面におけるシステムの予測と人間の判断とのギャップが明らかになります。
私たちの基本的なリソースが、人間の自然な省略判断に関するさらなる研究を促進することを願っています。

要約(オリジナル)

Speakers sometimes omit certain arguments of a predicate in a sentence; such omission is especially frequent in pro-drop languages. This study addresses a question about ellipsis — what can explain the native speakers’ ellipsis decisions? — motivated by the interest in human discourse processing and writing assistance for this choice. To this end, we first collect large-scale human annotations of whether and why a particular argument should be omitted across over 2,000 data points in the balanced corpus of Japanese, a prototypical pro-drop language. The data indicate that native speakers overall share common criteria for such judgments and further clarify their quantitative characteristics, e.g., the distribution of related linguistic factors in the balanced corpus. Furthermore, the performance of the language model-based argument ellipsis judgment model is examined, and the gap between the systems’ prediction and human judgments in specific linguistic aspects is revealed. We hope our fundamental resource encourages further studies on natural human ellipsis judgment.

arxiv情報

著者 Yukiko Ishizuki,Tatsuki Kuribayashi,Yuichiroh Matsubayashi,Ryohei Sasano,Kentaro Inui
発行日 2024-04-17 12:26:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク