Modeling Human Eye Movements with Neural Networks in a Maze-Solving Task

要約

動く物体をスムーズに追跡することから、視覚探索中に急速に視線を変えることまで、人間はさまざまな状況でさまざまな眼球運動戦略を採用しています。
眼球運動は精神プロセスへの豊富な窓を提供しますが、眼球運動の生成モデルを構築することは非常に困難であり、今日まで、眼球運動を導く計算目標は主に謎のままです.
この作業では、標準的な空間計画タスクである迷路解決のコンテキストでこれらの問題に取り組みました。
被験者から眼球運動データを収集し、視線固定と視線移動のための新しい微分可能なアーキテクチャを使用して、眼球運動の深い生成モデルを構築しました。
人間の目の動きは、可能な限り効率的にタスクを実行するのではなく、迷路を横断するオブジェクトの内部シミュレーションを実行するように最適化されたモデルによって最もよく予測されることがわかりました。
これは、このタスクにおける眼球運動の生成モデルを提供するだけでなく、人間がタスクを解決する方法に関する計算理論、つまり人間がメンタル シミュレーションを使用することも示唆しています。

要約(オリジナル)

From smoothly pursuing moving objects to rapidly shifting gazes during visual search, humans employ a wide variety of eye movement strategies in different contexts. While eye movements provide a rich window into mental processes, building generative models of eye movements is notoriously difficult, and to date the computational objectives guiding eye movements remain largely a mystery. In this work, we tackled these problems in the context of a canonical spatial planning task, maze-solving. We collected eye movement data from human subjects and built deep generative models of eye movements using a novel differentiable architecture for gaze fixations and gaze shifts. We found that human eye movements are best predicted by a model that is optimized not to perform the task as efficiently as possible but instead to run an internal simulation of an object traversing the maze. This not only provides a generative model of eye movements in this task but also suggests a computational theory for how humans solve the task, namely that humans use mental simulation.

arxiv情報

著者 Jason Li,Nicholas Watters,Yingting,Wang,Hansem Sohn,Mehrdad Jazayeri
発行日 2022-12-20 15:48:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, q-bio.NC パーマリンク