Grammatical Error Correction: A Survey of the State of the Art




– 文法エラー修正 (GEC) は、テキストの自動検出と修正のタスクです。
– このタスクには、文法的なエラーや、前置詞や主語・動詞の一致の不足といったものだけでなく、綴りの誤りや単語の選択の誤りなど、語彙的または意味的エラーも含まれます。
– 過去10年間で、規則ベースの方法、統計的分類器、統計的機械翻訳、そして現在の主流であるニューラル機械翻訳システムの開発を促した5つの共有タスクがあったことから、この分野は大きな進展を遂げました。
– この調査論文では、この分野を1つの記事にまとめ、言語的な課題のいくつかを概説し、英語および他の言語の研究者に利用可能な最も人気のあるデータセットを紹介し、特に人工エラー生成に重点を置いて、開発されたさまざまな方法や技術を要約します。
– 次に、評価についての多様なアプローチや、主観的な人間の判断に関するメトリックの信頼性についての懸念を説明し、最近の進展の概要と、将来の研究や残る課題についての提案を行い、この調査が、新規参入の研究者や最新の動向を知りたい研究者に包括的な情報源となることを期待しています。


Grammatical Error Correction (GEC) is the task of automatically detecting and correcting errors in text. The task not only includes the correction of grammatical errors, such as missing prepositions and mismatched subject-verb agreement, but also orthographic and semantic errors, such as misspellings and word choice errors respectively. The field has seen significant progress in the last decade, motivated in part by a series of five shared tasks, which drove the development of rule-based methods, statistical classifiers, statistical machine translation, and finally neural machine translation systems which represent the current dominant state of the art. In this survey paper, we condense the field into a single article and first outline some of the linguistic challenges of the task, introduce the most popular datasets that are available to researchers (for both English and other languages), and summarise the various methods and techniques that have been developed with a particular focus on artificial error generation. We next describe the many different approaches to evaluation as well as concerns surrounding metric reliability, especially in relation to subjective human judgements, before concluding with an overview of recent progress and suggestions for future work and remaining challenges. We hope that this survey will serve as comprehensive resource for researchers who are new to the field or who want to be kept apprised of recent developments.


著者 Christopher Bryant,Zheng Yuan,Muhammad Reza Qorib,Hannan Cao,Hwee Tou Ng,Ted Briscoe
発行日 2023-04-29 08:33:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク