Teach model to answer questions after comprehending the document


多肢選択機械読解 (MRC) は、自然言語処理 (NLP) の挑戦的な拡張機能であり、特定のテキスト内のエンティティ間の意味論と論理的関係を理解する能力を必要とします。
MRC タスクは伝統的に、与えられたテキストに基づいて質問に答えるプロセスとみなされてきました。
この 1 段階のアプローチにより、ネットワークは正解を生成することに集中することが多く、テキスト自体の理解が無視される可能性がありました。
この論文では、MRC タスクを 2 つの個別の段階に分割することで、ドキュメントをよりよく理解できるようにモデルを学習させる 2 段階の知識蒸留方法を提案します。


Multi-choice Machine Reading Comprehension (MRC) is a challenging extension of Natural Language Processing (NLP) that requires the ability to comprehend the semantics and logical relationships between entities in a given text. The MRC task has traditionally been viewed as a process of answering questions based on the given text. This single-stage approach has often led the network to concentrate on generating the correct answer, potentially neglecting the comprehension of the text itself. As a result, many prevalent models have faced challenges in performing well on this task when dealing with longer texts. In this paper, we propose a two-stage knowledge distillation method that teaches the model to better comprehend the document by dividing the MRC task into two separate stages. Our experimental results show that the student model, when equipped with our method, achieves significant improvements, demonstrating the effectiveness of our method.


著者 Ruiqing Sun,Ping Jian
発行日 2023-07-18 02:38:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク