Is Argument Structure of Learner Chinese Understandable: A Corpus-Based Analysis

要約

この論文は、中国語学習者における議論構造エラーのコーパスベースの分析を提示します。
分析用データには、言語学習者が作成した文章と、ネイティブスピーカーによる修正が含まれます。
このデータを、応用言語学を専攻する 2 人の上級生が手動で作成した意味役割ラベル付けの注釈と結合します。
注釈の手順は、もともと第一言語の現象をカバーするために開発された中国語 PropBank 仕様に従っています。
それにもかかわらず、第二言語現象を扱うには非常に包括的であることがわかります。
アノテーター間の一致度はかなり高く、学習者向けテキストがネイティブスピーカーにとって理解しやすいことを示唆しています。
注釈に基づいて、議論の構造に関連する能力エラーの予備分析を示します。
特に、語順、語選択、命題の欠如、引数と付属語の交絡に関連する音声エラーについて説明します。

要約(オリジナル)

This paper presents a corpus-based analysis of argument structure errors in learner Chinese. The data for analysis includes sentences produced by language learners as well as their corrections by native speakers. We couple the data with semantic role labeling annotations that are manually created by two senior students whose majors are both Applied Linguistics. The annotation procedure is guided by the Chinese PropBank specification, which is originally developed to cover first language phenomena. Nevertheless, we find that it is quite comprehensive for handling second language phenomena. The inter-annotator agreement is rather high, suggesting the understandability of learner texts to native speakers. Based on our annotations, we present a preliminary analysis of competence errors related to argument structure. In particular, speech errors related to word order, word selection, lack of proposition, and argument-adjunct confounding are discussed.

arxiv情報

著者 Yuguang Duan,Zi Lin,Weiwei Sun
発行日 2023-08-17 21:10:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク