Survey on Hand Gesture Recognition from Visual Input


この分野の急速な成長にもかかわらず、最近の研究開発、利用可能なソリューション、ベンチマーク データセットを包括的にカバーする調査はほとんどありません。
この調査では、RGB 画像、深度画像、単眼または多視点カメラからのビデオを含むさまざまな種類のカメラ入力データからハンド ジェスチャと 3D 手のポーズ認識の最新の進歩を調査し、各アプローチの異なる方法論的要件を調査することで、このギャップに対処します。
さらに、広く使用されているデータセットの概要が提供され、その主な特性とアプリケーション ドメインが詳しく説明されています。
最後に、現実世界の環境での堅牢な認識の実現、オクルージョンの処理、多様なユーザー間での一般化の確保、リアルタイム アプリケーションの計算効率への取り組みなどの未解決の課題が、将来の研究の方向性を導くために強調されています。


Hand gesture recognition has become an important research area, driven by the growing demand for human-computer interaction in fields such as sign language recognition, virtual and augmented reality, and robotics. Despite the rapid growth of the field, there are few surveys that comprehensively cover recent research developments, available solutions, and benchmark datasets. This survey addresses this gap by examining the latest advancements in hand gesture and 3D hand pose recognition from various types of camera input data including RGB images, depth images, and videos from monocular or multiview cameras, examining the differing methodological requirements of each approach. Furthermore, an overview of widely used datasets is provided, detailing their main characteristics and application domains. Finally, open challenges such as achieving robust recognition in real-world environments, handling occlusions, ensuring generalization across diverse users, and addressing computational efficiency for real-time applications are highlighted to guide future research directions. By synthesizing the objectives, methodologies, and applications of recent studies, this survey offers valuable insights into current trends, challenges, and opportunities for future research in human hand gesture recognition.


著者 Manousos Linardakis,Iraklis Varlamis,Georgios Th. Papadopoulos
発行日 2025-01-21 09:23:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク