要約
近年、人間の注意モデリングは、視覚探索の基礎となる認知プロセスを理解するだけでなく、画像やビデオの処理、視覚などのさまざまな領域の問題を解決することを目的とした人工知能モデルのサポートを提供するのにも特に有用であることが証明されています。
-および言語アプリケーション、および言語モデリング。
この調査は、人間の注意メカニズムを現代の深層学習モデルに統合するための最近の取り組みの合理的な概要を提供し、将来の研究の方向性と課題について議論します。
現在進行中の研究に関する包括的な概要については、https://github.com/aimagelab/awesome-human-visual-attention で利用できる専用リポジトリを参照してください。
要約(オリジナル)
Human attention modelling has proven, in recent years, to be particularly useful not only for understanding the cognitive processes underlying visual exploration, but also for providing support to artificial intelligence models that aim to solve problems in various domains, including image and video processing, vision-and-language applications, and language modelling. This survey offers a reasoned overview of recent efforts to integrate human attention mechanisms into contemporary deep learning models and discusses future research directions and challenges. For a comprehensive overview on the ongoing research refer to our dedicated repository available at https://github.com/aimagelab/awesome-human-visual-attention.
arxiv情報
著者 | Giuseppe Cartella,Marcella Cornia,Vittorio Cuculo,Alessandro D’Amelio,Dario Zanca,Giuseppe Boccignone,Rita Cucchiara |
発行日 | 2024-04-22 17:54:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google