要約
調査は、通常のカメラやリアルタイム用の深度カメラなどのさまざまなテクノロジーを使用した感情認識での姿勢推定技術の使用と、VR および画像、ビデオ、ベクトル空間で記述された 3 次元ポーズを含む入力の潜在的な使用に焦点を当てて提示されます。
私たちは、感情認識と姿勢推定に関連する方法論、分類アルゴリズム、および使用されたデータセットに焦点を当てた、厳選されたジャーナルとデータベースから収集した 19 件の研究論文について議論しました。
最も一般的に使用されるパフォーマンス測定基準であるため、その精度に従ってベンチマークが作成されました。
私たちは、マルチモーダルアプローチが全体的に最高の精度をもたらしたと結論付け、その後、この研究テーマの発展を改善できる将来的な懸念について言及しました。
要約(オリジナル)
A survey is presented focused on using pose estimation techniques in Emotional recognition using various technologies normal cameras, and depth cameras for real-time, and the potential use of VR and inputs including images, videos, and 3-dimensional poses described in vector space. We discussed 19 research papers collected from selected journals and databases highlighting their methodology, classification algorithm, and the used datasets that relate to emotion recognition and pose estimation. A benchmark has been made according to their accuracy as it was the most common performance measurement metric used. We concluded that the multimodal Approaches overall made the best accuracy and then we mentioned futuristic concerns that can improve the development of this research topic.
arxiv情報
著者 | Leina Elansary,Zaki Taha,Walaa Gad |
発行日 | 2024-11-19 13:42:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google