WebQAmGaze: A Multilingual Webcam Eye-Tracking-While-Reading Dataset



– WebQAmGazeは、公正で透明なNLPモデルの開発を支援するために設計された、多言語の低コストアイ・トラッキングしながら読むデータセットです。
– WebQAmGazeには、332人の参加者が自然な形で英語、スペイン語、ドイツ語のテキストを読むときのウェブカメラアイ・トラッキングデータが含まれています。
– 各参加者は、5つのテキストから構成される2つの読書課題、通常の読書課題と情報収集課題を実行します。
– データの前処理後、関連する範囲での視線停留時間は、理解に関する質問に答えるときの正解を示すことがあります。
– さらに、収集したデータを高品質のアイ・トラッキングデータと比較的な解析を行いました。
– 結果は、ウェブカメラアイ・トラッキングデバイスで得られた特徴と商用のアイ・トラッキングデバイスで得られた特徴の間に中程度の相関があることを示しています。
– WebQAmGazeは、ウェブカメラを使った読書に関する研究を進め、より安価でアクセスしやすいデータ収集の方法を開拓することができます。
– WebQAmGazeは、質問回答(QA)の認知プロセスを学び、言語理解の計算モデルにこれらの洞察を適用するのに役立ちます。


We create WebQAmGaze, a multilingual low-cost eye-tracking-while-reading dataset, designed to support the development of fair and transparent NLP models. WebQAmGaze includes webcam eye-tracking data from 332 participants naturally reading English, Spanish, and German texts. Each participant performs two reading tasks composed of five texts, a normal reading and an information-seeking task. After preprocessing the data, we find that fixations on relevant spans seem to indicate correctness when answering the comprehension questions. Additionally, we perform a comparative analysis of the data collected to high-quality eye-tracking data. The results show a moderate correlation between the features obtained with the webcam-ET compared to those of a commercial ET device. We believe this data can advance webcam-based reading studies and open a way to cheaper and more accessible data collection. WebQAmGaze is useful to learn about the cognitive processes behind question answering (QA) and to apply these insights to computational models of language understanding.


著者 Tiago Ribeiro,Stephanie Brandl,Anders Søgaard,Nora Hollenstein
発行日 2023-04-14 06:22:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク