要約
我々は、説明可能な計算言語処理モデルの開発をサポートする初のウェブカメラベースの読書視線追跡コーパスとして設計された、多言語の低コスト読書中の視線追跡データセットである WebQAmGaze を紹介します。
WebQAmGaze には、英語、ドイツ語、スペイン語、トルコ語のテキストを自然に読んでいる幅広い年齢層の 600 人の参加者からの Web カメラ視線追跡データが含まれています。
各参加者は、それぞれ 5 つのテキストから構成される 2 つの読書タスク (通常の読書タスクと情報探索タスク、その後に理解に関する質問) を実行します。
収集したウェブカメラのデータを高品質の視線追跡記録と比較します。
結果は、Web カメラで取得した眼球運動測定値と市販の視線追跡デバイスで取得した眼球運動測定値の間に中程度から強い相関関係があることを示しています。
データを検証すると、関連するテキスト範囲の注視時間が長いほど、対応する質問に回答する際の正しさを正確に示していることがわかります。
このデータセットは、ウェブカメラベースの読書研究を前進させ、低コストで多様なデータ収集への道を開きます。
WebQAmGaze は、質問応答の背後にある認知プロセスについて学び、これらの洞察を言語理解の計算モデルに適用するのに役立ちます。
要約(オリジナル)
We present WebQAmGaze, a multilingual low-cost eye-tracking-while-reading dataset, designed as the first webcam-based eye-tracking corpus of reading to support the development of explainable computational language processing models. WebQAmGaze includes webcam eye-tracking data from 600 participants of a wide age range naturally reading English, German, Spanish, and Turkish texts. Each participant performs two reading tasks composed of five texts each, a normal reading and an information-seeking task, followed by a comprehension question. We compare the collected webcam data to high-quality eye-tracking recordings. The results show a moderate to strong correlation between the eye movement measures obtained with the webcam compared to those obtained with a commercial eye-tracking device. When validating the data, we find that higher fixation duration on relevant text spans accurately indicates correctness when answering the corresponding questions. This dataset advances webcam-based reading studies and opens avenues to low-cost and diverse data collection. WebQAmGaze is beneficial to learn about the cognitive processes behind question-answering and to apply these insights to computational models of language understanding.
arxiv情報
著者 | Tiago Ribeiro,Stephanie Brandl,Anders Søgaard,Nora Hollenstein |
発行日 | 2024-03-15 12:01:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google