2D Image head pose estimation via latent space regression under occlusion settings

要約

頭の向きはコンピューター ビジョンの難しい問題であり、さまざまな用途に使用できるよう広範囲に研究されています。
ただし、現在の最先端のシステムは、オクルージョンが存在すると依然としてパフォーマンスが低下し、そのようなシナリオでは多くのタスク アプリケーションに対して信頼性が低くなります。
この研究は、オクルージョン下での頭姿勢推定の問題に対する新しい深層学習アプローチを提案しています。
この戦略は、遮蔽されたシナリオの問題をより適切に構造化するための基本的な鍵として、潜在空間回帰に基づいています。
私たちのモデルは、オクルージョンされた HPE に対するいくつかの最先端の方法論を上回り、オクルージョンされていないシナリオでも同様の精度を達成します。
我々は、(i) BIWI および AFLW2000 データセットの 2 つの合成オクルージョン バージョン、(ii) Pandora データセットの現実のオクルージョン、および (iii) 人間とロボットのインタラクションへの現実のアプリケーションを使用して、提案されたアプローチの有用性を実証します。
顔のオクルージョンが頻繁に発生するシナリオ。
具体的には、ロボットアームによる自律的な給餌です。

要約(オリジナル)

Head orientation is a challenging Computer Vision problem that has been extensively researched having a wide variety of applications. However, current state-of-the-art systems still underperform in the presence of occlusions and are unreliable for many task applications in such scenarios. This work proposes a novel deep learning approach for the problem of head pose estimation under occlusions. The strategy is based on latent space regression as a fundamental key to better structure the problem for occluded scenarios. Our model surpasses several state-of-the-art methodologies for occluded HPE, and achieves similar accuracy for non-occluded scenarios. We demonstrate the usefulness of the proposed approach with: (i) two synthetically occluded versions of the BIWI and AFLW2000 datasets, (ii) real-life occlusions of the Pandora dataset, and (iii) a real-life application to human-robot interaction scenarios where face occlusions often occur. Specifically, the autonomous feeding from a robotic arm.

arxiv情報

著者 José Celestino,Manuel Marques,Jacinto C. Nascimento,João Paulo Costeira
発行日 2023-11-10 12:53:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク