Conversations as a Source for Teaching Scientific Concepts at Different Education Levels

要約

オープンな会話は、最も魅力的な教育形式の 1 つです。
ただし、教育用ソフトウェアでこうした会話を作成するのは、特にさまざまな聴衆のニーズに対応したい場合には、複雑な作業になります。
言語モデルは教育用途に大きな期待を持っていますが、特にさまざまな聴衆の多様なニーズを考慮した場合、有意義で効果的な会話教育に従事するように言語モデルをトレーニングするには大きな課題があります。
さまざまな聴衆の多様なニーズを考慮して、会話教育用の言語モデルのトレーニングを容易にするこのタスク用の公式データセットは存在しません。
この論文では、さまざまな難易度 (未就学児から専門家まで) での科学概念の会話教育を促進するための新しいソース、つまりビデオトランスクリプトから取られた対話を紹介します。
私たちはこのデータ ソースをさまざまな方法で分析し、特定の対象読者向けの科学トピックに対する文脈上適切で自然な反応を生成するために使用できる多様な例を提供していることを示します。
これは、有機的に発生する対話を含む会話モデルのトレーニングと評価に無料で利用できる貴重なリソースです。
生データはオンラインで入手できますが、入手可能なすべてのビデオの各レベルでの対話の会話分析用に追加のメタデータが提供されます。

要約(オリジナル)

Open conversations are one of the most engaging forms of teaching. However, creating those conversations in educational software is a complex endeavor, especially if we want to address the needs of different audiences. While language models hold great promise for educational applications, there are substantial challenges in training them to engage in meaningful and effective conversational teaching, especially when considering the diverse needs of various audiences. No official data sets exist for this task to facilitate the training of language models for conversational teaching, considering the diverse needs of various audiences. This paper presents a novel source for facilitating conversational teaching of scientific concepts at various difficulty levels (from preschooler to expert), namely dialogues taken from video transcripts. We analyse this data source in various ways to show that it offers a diverse array of examples that can be used to generate contextually appropriate and natural responses to scientific topics for specific target audiences. It is a freely available valuable resource for training and evaluating conversation models, encompassing organically occurring dialogues. While the raw data is available online, we provide additional metadata for conversational analysis of dialogues at each level in all available videos.

arxiv情報

著者 Donya Rooein,Dirk Hovy
発行日 2024-04-16 11:33:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク