Is Japanese CCGBank empirically correct? A case study of passive and causative constructions

要約

Japanese CCGBank は、日本語 CCG パーサーを開発するためのトレーニングおよび評価データとして機能します。
ただし、ディペンデンシーツリーバンクである京都コーパスから自動生成されるため、言語学的な妥当性については十分に検証する必要があります。
この論文では、日本の CCGBank における受動態/使役構造の分析に焦点を当て、セマンティック解析システムである ccg2lambda の合成セマンティクスと共に、受動態と使役構造のネストされた構造について経験的に間違った予測を生成することを示します。

要約(オリジナル)

The Japanese CCGBank serves as training and evaluation data for developing Japanese CCG parsers. However, since it is automatically generated from the Kyoto Corpus, a dependency treebank, its linguistic validity still needs to be sufficiently verified. In this paper, we focus on the analysis of passive/causative constructions in the Japanese CCGBank and show that, together with the compositional semantics of ccg2lambda, a semantic parsing system, it yields empirically wrong predictions for the nested construction of passives and causatives.

arxiv情報

著者 Daisuke Bekki,Hitomi Yanaka
発行日 2023-02-28 16:19:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク