WebQAmGaze: A Multilingual Webcam Eye-Tracking-While-Reading Dataset

要約

【タイトル】WebQAmGaze:多言語ウェブカメラ読書時アイ・トラッキングデータセット【要約】
– WebQAmGazeは、公正で透明な自然言語処理モデルの開発を支援するために設計され、英語、スペイン語、そしてドイツ語のテキストを自然に読んでいる332人の参加者からウェブカメラアイ・トラッキングデータを収集した、多言語低コストの読書時アイ・トラッキング・データセットである。
– 各参加者は、通常の読書と情報検索タスクから成る2つの読書課題を行い、データの前処理を行った後、関連範囲の視線が理解度の答えに正確に対応していることが分かった。
– さらに、収集されたデータを高品質アイ・トラッキングデータと比較して解析し、ウェブカメラのETと商用のET装置との間に中程度の相関があることが分かった。
– このようなデータ収集によって、より安価でアクセスしやすい方法が確立されたことで、WebQAmGazeはウェブカメラベースの読書研究を推進し、質問応答(QA)の認知プロセスについて理解を深め、言語理解の計算モデルにこの知見を適用するために役立つ。

要約(オリジナル)

We create WebQAmGaze, a multilingual low-cost eye-tracking-while-reading dataset, designed to support the development of fair and transparent NLP models. WebQAmGaze includes webcam eye-tracking data from 332 participants naturally reading English, Spanish, and German texts. Each participant performs two reading tasks composed of five texts, a normal reading and an information-seeking task. After preprocessing the data, we find that fixations on relevant spans seem to indicate correctness when answering the comprehension questions. Additionally, we perform a comparative analysis of the data collected to high-quality eye-tracking data. The results show a moderate correlation between the features obtained with the webcam-ET compared to those of a commercial ET device. We believe this data can advance webcam-based reading studies and open a way to cheaper and more accessible data collection. WebQAmGaze is useful to learn about the cognitive processes behind question answering (QA) and to apply these insights to computational models of language understanding.

arxiv情報

著者 Tiago Ribeiro,Stephanie Brandl,Anders Søgaard,Nora Hollenstein
発行日 2023-03-31 08:18:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク