An Intuitive and Unconstrained 2D Cube Representation for Simultaneous Head Detection and Pose Estimation

要約

最新の頭部姿勢推定 (HPE) メソッドは、オイラー角表現によって支配されています。
回転ラベル固有のあいまいさの問題を回避するために、代替のクォータニオン ベースおよびベクトル ベースの表現が導入されています。
ただし、どちらも視覚的に直感的ではなく、多くの場合、あいまいなオイラー角ラベルから派生します。
この論文では、{\it 直感的} および {\it unconstrained} 2D キューブ表現を介して、ジョイント ヘッド検出とポーズ推定のための新しいシングル ステージ キーポイント ベースの方法を提示します。
2D 立方体は、1 つの頭をほぼ取り囲む 3D 正六面体ラベルの正射影であり、それ自体に頭の位置が含まれています。
どの回転角度でも、頭の向きを明確かつ明確に反映できます。
一般的な 6-DoF オブジェクトの姿勢推定とは異なり、この 2D キューブは 3-DoF の頭部サイズを無視しますが、3-DoF の頭部姿勢を保持します。
等辺長の事前確率に基づいて、エラーが発生しやすい PnP アルゴリズムを適用する代わりに、予測された 2D ヘッド キューブからオイラー角の閉形式解を簡単に取得できます。
実験では、提案された方法は、公開されている AFLW2000 および BIWI データセットで他の代表的な方法と同等の結果を達成しています。
その上、CMU パノプティック データセットに対する新しいテストは、私たちの方法が変更なしで制約のないフルビュー HPE タスクにシームレスに適応できることを示しています。

要約(オリジナル)

Most recent head pose estimation (HPE) methods are dominated by the Euler angle representation. To avoid its inherent ambiguity problem of rotation labels, alternative quaternion-based and vector-based representations are introduced. However, they both are not visually intuitive, and often derived from equivocal Euler angle labels. In this paper, we present a novel single-stage keypoint-based method via an {\it intuitive} and {\it unconstrained} 2D cube representation for joint head detection and pose estimation. The 2D cube is an orthogonal projection of the 3D regular hexahedron label roughly surrounding one head, and itself contains the head location. It can reflect the head orientation straightforwardly and unambiguously in any rotation angle. Unlike the general 6-DoF object pose estimation, our 2D cube ignores the 3-DoF of head size but retains the 3-DoF of head pose. Based on the prior of equal side length, we can effortlessly obtain the closed-form solution of Euler angles from predicted 2D head cube instead of applying the error-prone PnP algorithm. In experiments, our proposed method achieves comparable results with other representative methods on the public AFLW2000 and BIWI datasets. Besides, a novel test on the CMU panoptic dataset shows that our method can be seamlessly adapted to the unconstrained full-view HPE task without modification.

arxiv情報

著者 Huayi Zhou,Fei Jiang,Lili Xiong,Hongtao Lu
発行日 2022-12-07 13:28:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク