Categorizing the Visual Environment and Analyzing the Visual Attention of Dogs


私たちは、11,698 件以上の視線を含むデータセットを収集して研究し、大学のキャンパスや都市部の散歩など、日常の屋外環境で 11 頭の犬が見つめる対象を分類しました。
収集されたデータのごく一部 (約 600 枚の画像、またはデータセット全体の 20% 未満) を使用して、新しい画像ドメインの MaskRCNN を微調整して、シーン内に存在するオブジェクトをセグメント化し、視覚的な視線傾向に関するさらなる統計分析を可能にします。
MaskRCNN は視線追跡装置を備えており、犬の固視を自動的に分類するためのエンドツーエンドのモデルとして機能します。
微調整された MaskRCNN は偶然よりもはるかに優れたパフォーマンスを発揮します。
11 頭の犬の間には個体差はほとんどなく、バス、プラント、舗装、建設機械への視線の集中がより顕著であることが観察されました。


Dogs have a unique evolutionary relationship with humans and serve many important roles e.g. search and rescue, blind assistance, emotional support. However, few datasets exist to categorize visual features and objects available to dogs, as well as how dogs direct their visual attention within their environment. We collect and study a dataset with over 11,698 gazes to categorize the objects available to be gazed at by 11 dogs in everyday outdoor environments i.e. a walk around a college campus and urban area. We explore the availability of these object categories and the visual attention of dogs over these categories using a head mounted eye tracking apparatus. A small portion (approx. 600 images or < 20% of total dataset) of the collected data is used to fine tune a MaskRCNN for the novel image domain to segment objects present in the scene, enabling further statistical analysis on the visual gaze tendencies of dogs. The MaskRCNN, with eye tracking apparatus, serves as an end to end model for automatically classifying the visual fixations of dogs. The fine tuned MaskRCNN performs far better than chance. There are few individual differences between the 11 dogs and we observe greater visual fixations on buses, plants, pavement, and construction equipment. This work takes a step towards understanding visual behavior of dogs and their interaction with the physical world.


著者 Shreyas Sundara Raman,Madeline H. Pelgrim,Daphna Buchsbaum,Thomas Serre
発行日 2023-11-20 18:21:18+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.AI, cs.CV パーマリンク