DiffPose: Toward More Reliable 3D Pose Estimation

要約

単眼の 3D 人間の姿勢推定は、特有のあいまいさとオクルージョンのために非常に困難であり、高い不確実性と不確定性につながることがよくあります。
一方、拡散モデルは、ノイズから高品質の画像を生成するための効果的なツールとして最近登場しました。
彼らの能力に触発されて、逆拡散プロセスとして 3D 姿勢推定を定式化する新しい姿勢推定フレームワーク (DiffPose) を探ります。
3D ポーズ推定の拡散プロセスを促進する新しいデザインを DiffPose に組み込みます。ポーズの不確実性分布のポーズ固有の初期化、ガウス混合モデルベースの前方拡散プロセス、およびコンテキスト条件付き逆拡散プロセスです。
提案された DiffPose は、広く使用されている姿勢推定ベンチマーク Human3.6M および MPI-INF-3DHP で既存の方法よりも大幅に優れています。

要約(オリジナル)

Monocular 3D human pose estimation is quite challenging due to the inherent ambiguity and occlusion, which often lead to high uncertainty and indeterminacy. On the other hand, diffusion models have recently emerged as an effective tool for generating high-quality images from noise. Inspired by their capability, we explore a novel pose estimation framework (DiffPose) that formulates 3D pose estimation as a reverse diffusion process. We incorporate novel designs into our DiffPose that facilitate the diffusion process for 3D pose estimation: a pose-specific initialization of pose uncertainty distributions, a Gaussian Mixture Model-based forward diffusion process, and a context-conditioned reverse diffusion process. Our proposed DiffPose significantly outperforms existing methods on the widely used pose estimation benchmarks Human3.6M and MPI-INF-3DHP.

arxiv情報

著者 Jia Gong,Lin Geng Foo,Zhipeng Fan,Qiuhong Ke,Hossein Rahmani,Jun Liu
発行日 2022-11-30 12:22:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク