要約
文章の中で質問を使用することは、読みやすさを高める効果的な戦略です。
しかし、積極的な読書の質問がなぜ良いのか、これらの質問の言語的役割は何なのか、人間の読書にどのような影響を与えるのかは、まだ十分に研究されていません。
教科書や科学論文からの 10,000 個の文中質問のデータセットである GuidingQ を紹介します。
データセットを分析することにより、これらの質問の使用、分布、および言語的特徴を包括的に理解できます。
次に、言語モデルを使用してそのような質問を生成するためのさまざまなアプローチを検討します。
私たちの結果は、質問間の関係を把握することの重要性と、これらの質問を生成する際の質問位置の特定の課題を浮き彫りにしています。
最後に、このような質問が読解力に及ぼす影響を理解するために人間を対象とした研究を実施します。
生成された質問は高品質であり、読者の記憶力と理解を向上させるという点では人間が書いた質問とほぼ同じ効果があることがわかりました。
要約(オリジナル)
Using questions in written text is an effective strategy to enhance readability. However, what makes an active reading question good, what the linguistic role of these questions is, and what is their impact on human reading remains understudied. We introduce GuidingQ, a dataset of 10K in-text questions from textbooks and scientific articles. By analyzing the dataset, we present a comprehensive understanding of the use, distribution, and linguistic characteristics of these questions. Then, we explore various approaches to generate such questions using language models. Our results highlight the importance of capturing inter-question relationships and the challenge of question position identification in generating these questions. Finally, we conduct a human study to understand the implication of such questions on reading comprehension. We find that the generated questions are of high quality and are almost as effective as human-written questions in terms of improving readers’ memorization and comprehension.
arxiv情報
著者 | Peng Cui,Vilém Zouhar,Xiaoyu Zhang,Mrinmaya Sachan |
発行日 | 2024-07-19 13:42:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google