要約
これまでの研究は主に、単一言語の英語の意味解析に焦点を当てていました。
代わりに、中国語の意味表現のラベル付きデータがない場合の中国語の意味解析の実現可能性を調査します。
逐次ニューラル ネットワーク用に線形化された中国語の意味表現データを自動的に収集するパイプラインについて説明します。
さらに、中国語の意味解析用に明示的に設計されたテスト スイートを提案します。これは、中国語の解析の難しさを研究することを目的として、解析パフォーマンスのきめ細かい評価を提供します。
私たちの実験結果は、中国語の意味解析の難しさは主に副詞によって引き起こされることを示しています。
機械翻訳と英語パーサーを通じて中国語の解析を実現すると、中国語データでモデルを直接トレーニングするよりもパフォーマンスがわずかに低下します。
要約(オリジナル)
Previous work has predominantly focused on monolingual English semantic parsing. We, instead, explore the feasibility of Chinese semantic parsing in the absence of labeled data for Chinese meaning representations. We describe the pipeline of automatically collecting the linearized Chinese meaning representation data for sequential-to sequential neural networks. We further propose a test suite designed explicitly for Chinese semantic parsing, which provides fine-grained evaluation for parsing performance, where we aim to study Chinese parsing difficulties. Our experimental results show that the difficulty of Chinese semantic parsing is mainly caused by adverbs. Realizing Chinese parsing through machine translation and an English parser yields slightly lower performance than training a model directly on Chinese data.
arxiv情報
著者 | Chunliu Wang,Xiao Zhang,Johan Bos |
発行日 | 2023-06-16 09:47:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google