Dual input stream transformer for vertical drift correction in eye-tracking reading data

要約

文章を読んでいる間に収集された視線追跡データから、読者が実際に注目していたテキスト行に注視点を割り当てるという難しい問題に対して、新しいデュアル入力ストリーム変換器 (DIST) を導入します。
垂直方向のドリフトの形でノイズが存在するため、この後処理ステップは読み取りデータの分析にとって重要です。
私たちは、9 つ​​の多様なデータセットからなる包括的なスイートに対する 11 の古典的なアプローチに対して DIST を評価します。
アンサンブル内で DIST モデルの複数のインスタンスを組み合わせることで、すべてのデータセットにわたって高い精度が達成されることを実証します。
さらに DIST アンサンブルを古典的な最良のアプローチと組み合わせると、平均精度 98.17 % が得られます。
私たちのアプローチは、読書調査における手動行割り当てのボトルネックに対処するための重要な一歩を示しています。
広範な分析とアブレーション研究を通じて、ラインオーバーラップ機能の組み込みや 2 番目の入力ストリームの使用など、DIST の成功に貢献する重要な要素を特定しました。
厳密な評価により、DIST がさまざまな実験設定に対して堅牢であり、この分野の専門家にとって安全な最初の選択肢となることが実証されています。

要約(オリジナル)

We introduce a novel Dual Input Stream Transformer (DIST) for the challenging problem of assigning fixation points from eye-tracking data collected during passage reading to the line of text that the reader was actually focused on. This post-processing step is crucial for analysis of the reading data due to the presence of noise in the form of vertical drift. We evaluate DIST against eleven classical approaches on a comprehensive suite of nine diverse datasets. We demonstrate that combining multiple instances of the DIST model in an ensemble achieves high accuracy across all datasets. Further combining the DIST ensemble with the best classical approach yields an average accuracy of 98.17 %. Our approach presents a significant step towards addressing the bottleneck of manual line assignment in reading research. Through extensive analysis and ablation studies, we identify key factors that contribute to DIST’s success, including the incorporation of line overlap features and the use of a second input stream. Via rigorous evaluation, we demonstrate that DIST is robust to various experimental setups, making it a safe first choice for practitioners in the field.

arxiv情報

著者 Thomas M. Mercier,Marcin Budka,Martin R. Vasilev,Julie A. Kirkby,Bernhard Angele,Timothy J. Slattery
発行日 2024-02-15 17:05:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 91Cxx, cs.CV, cs.LG, J.4 パーマリンク