2D Image head pose estimation via latent space regression under occlusion settings


頭の向きはコンピューター ビジョンの難しい問題であり、さまざまな用途に使用できるよう広範囲に研究されています。
ただし、現在の最先端のシステムは、オクルージョンが存在すると依然としてパフォーマンスが低下し、そのようなシナリオでは多くのタスク アプリケーションに対して信頼性が低くなります。
私たちのモデルは、オクルージョンされた HPE に対するいくつかの最先端の方法論を上回り、オクルージョンされていないシナリオでも同様の精度を達成します。
我々は、(i) BIWI および AFLW2000 データセットの 2 つの合成オクルージョン バージョン、(ii) Pandora データセットの現実のオクルージョン、および (iii) 人間とロボットのインタラクションへの現実のアプリケーションを使用して、提案されたアプローチの有用性を実証します。


Head orientation is a challenging Computer Vision problem that has been extensively researched having a wide variety of applications. However, current state-of-the-art systems still underperform in the presence of occlusions and are unreliable for many task applications in such scenarios. This work proposes a novel deep learning approach for the problem of head pose estimation under occlusions. The strategy is based on latent space regression as a fundamental key to better structure the problem for occluded scenarios. Our model surpasses several state-of-the-art methodologies for occluded HPE, and achieves similar accuracy for non-occluded scenarios. We demonstrate the usefulness of the proposed approach with: (i) two synthetically occluded versions of the BIWI and AFLW2000 datasets, (ii) real-life occlusions of the Pandora dataset, and (iii) a real-life application to human-robot interaction scenarios where face occlusions often occur. Specifically, the autonomous feeding from a robotic arm.


著者 José Celestino,Manuel Marques,Jacinto C. Nascimento,João Paulo Costeira
発行日 2023-11-10 12:53:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク