要約
近年、中国語スペル チェック (CSC) は、タスク固有の事前トレーニング方法を設計したり、主にこのタスクをエンドツーエンド方式で解決する補助タスクを導入したりすることによって大幅に改善されました。
この論文では、中国語に関する豊富な外部知識をより直接的かつ効率的に活用できるように、CSC ワークフローを検出、推論、および検索のサブタスクに分解することを提案します。
具体的には、既存の SOTA 非自己回帰 CSC モデルと互換性のあるプラグアンドプレイの検出および推論モジュールを設計し、パフォーマンスをさらに向上させます。
あるモデル用にトレーニングされた検出および推論モジュールは、他のモデルにも利益をもたらすことがわかりました。
また、タスクの分解によってもたらされる主な解釈可能性についても研究します。
広範な実験と詳細な分析により、提案されたモジュールの有効性と競争力が実証されています。
要約(オリジナル)
In recent years, Chinese Spelling Check (CSC) has been greatly improved by designing task-specific pre-training methods or introducing auxiliary tasks, which mostly solve this task in an end-to-end fashion. In this paper, we propose to decompose the CSC workflow into detection, reasoning, and searching subtasks so that the rich external knowledge about the Chinese language can be leveraged more directly and efficiently. Specifically, we design a plug-and-play detection-and-reasoning module that is compatible with existing SOTA non-autoregressive CSC models to further boost their performance. We find that the detection-and-reasoning module trained for one model can also benefit other models. We also study the primary interpretability provided by the task decomposition. Extensive experiments and detailed analyses demonstrate the effectiveness and competitiveness of the proposed module.
arxiv情報
著者 | Haojing Huang,Jingheng Ye,Qingyu Zhou,Yinghui Li,Yangning Li,Feng Zhou,Hai-Tao Zheng |
発行日 | 2023-10-13 14:03:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google