要約
RGB画像からの3次元人体形状・姿勢推定は、拡張/仮想現実、ヘルスケア、フィットネス技術、仮想小売業への応用が期待される難問である。最近の解決策では、i)単一画像、ii)マルチビュー画像、iii)動画の3種類の入力に焦点を当てている。本研究では、コンテンポラリーダンスとパフォーミングアートのための3D身体形状とポーズ推定法を、特に人体のポーズと着衣、カメラ視点、照明条件、背景条件に焦点を当てて調査し、比較した。その結果、ダンサーがコンテンポラリーダンスを踊っている場合、PHALPのようなマルチフレーム法は、シングルフレーム法よりも優れたポーズ推定結果を提供することが実証された。
要約(オリジナル)
3D human body shape and pose estimation from RGB images is a challenging problem with potential applications in augmented/virtual reality, healthcare and fitness technology and virtual retail. Recent solutions have focused on three types of inputs: i) single images, ii) multi-view images and iii) videos. In this study, we surveyed and compared 3D body shape and pose estimation methods for contemporary dance and performing arts, with a special focus on human body pose and dressing, camera viewpoint, illumination conditions and background conditions. We demonstrated that multi-frame methods, such as PHALP, provide better results than single-frame method for pose estimation when dancers are performing contemporary dances.
arxiv情報
著者 | Darshan Venkatrayappa,Alain Tremeau,Damien Muselet,Philippe Colantoni |
発行日 | 2024-01-04 17:51:44+00:00 |
arxivサイト | arxiv_id(pdf) |