Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems


高度なマルチモーダル AI エージェントは、ユーザーと協力して世界の課題を解決できるようになりました。
この知識により、AI エージェントの状況理解が向上すると仮説を立てています。
次に、マルチモーダル エージェントをクエリする追加のコンテキストとしてユーザーのスキャンパス履歴を中継する実験を実施します。


Advanced multimodal AI agents can now collaborate with users to solve challenges in the world. We explore eye tracking’s role in such interaction to convey a user’s attention relative to the physical environment. We hypothesize that this knowledge improves contextual understanding for AI agents. By observing hours of human-object interactions, we first measure the relationship between an eye tracker’s signal quality and its ability to reliably place gaze on nearby physical objects. We then conduct experiments which relay the user’s scanpath history as additional context querying multimodal agents. Our results show that eye tracking provides high value as a user attention signal and can convey information about the user’s current task and interests to the agent.


著者 Ethan Wilson,Naveen Sendhilnathan,Charlie S. Burlingham,Yusuf Mansour,Robert Cavin,Sai Deep Tetali,Ajoy Savio Fernandes,Michael J. Proulx
発行日 2025-01-23 17:51:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC パーマリンク