要約
この論文では、長距離にわたるヒューマン ロボット インタラクション (HRI) の課題に対処する、超長距離ジェスチャ認識のための新しいアプローチを紹介します。
ビデオデータ内の人間のジェスチャーを活用することで、現在の手法の限界を超え、ロボットが長距離からのジェスチャーを理解できるようにする、時空間融合ネットワーク (TSFN) モデルを提案します。
サービス ロボット、捜索救助活動、ドローン ベースのインタラクションに応用することで、当社のアプローチは広大な環境における HRI を強化します。
実験による検証では、特に長時間のジェスチャ シーケンスにおいて、ジェスチャ認識精度が大幅に向上していることが実証されました。
要約(オリジナル)
This paper presents a novel approach for ultra-range gesture recognition, addressing Human-Robot Interaction (HRI) challenges over extended distances. By leveraging human gestures in video data, we propose the Temporal-Spatiotemporal Fusion Network (TSFN) model that surpasses the limitations of current methods, enabling robots to understand gestures from long distances. With applications in service robots, search and rescue operations, and drone-based interactions, our approach enhances HRI in expansive environments. Experimental validation demonstrates significant advancements in gesture recognition accuracy, particularly in prolonged gesture sequences.
arxiv情報
著者 | Eran Bamani Beeri,Eden Nissinman,Avishai Sintov |
発行日 | 2024-07-31 06:56:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google