Latent Embedding Clustering for Occlusion Robust Head Pose Estimation

要約

頭姿勢推定は、ロボット工学、監視、ドライバーの注意監視などの幅広い用途で有用であるため、コンピューター ビジョンの研究において重要な分野となっています。
この分野での最も困難な課題の 1 つは、現実世界のシナリオで頻繁に発生する頭部の閉塞を管理することです。
この論文では、現実世界の頭部閉塞シナリオにおいて堅牢な、新しく効率的なフレームワークを提案します。
特に、ポーズ角度ごとに回帰および分類コンポーネントを使用した教師なし潜在埋め込みクラスタリングを提案します。
このモデルは、クラスタリング項を通じてオクルージョンされた画像とオクルージョンされていない画像の潜在的な特徴表現を最適化し、同時にきめ細かい角度予測を改善します。
実環境での頭部姿勢ベンチマーク データセットの実験評価により、大幅なデータ削減という利点を備えた、最先端の方法論と比較して競争力のあるパフォーマンスが明らかになりました。
遮られた頭部の姿勢推定において大幅な改善が見られます。
また、提案されたフレームワーク内でのクラスタリング用語の影響を確認するためにアブレーション研究が実行されます。

要約(オリジナル)

Head pose estimation has become a crucial area of research in computer vision given its usefulness in a wide range of applications, including robotics, surveillance, or driver attention monitoring. One of the most difficult challenges in this field is managing head occlusions that frequently take place in real-world scenarios. In this paper, we propose a novel and efficient framework that is robust in real world head occlusion scenarios. In particular, we propose an unsupervised latent embedding clustering with regression and classification components for each pose angle. The model optimizes latent feature representations for occluded and non-occluded images through a clustering term while improving fine-grained angle predictions. Experimental evaluation on in-the-wild head pose benchmark datasets reveal competitive performance in comparison to state-of-the-art methodologies with the advantage of having a significant data reduction. We observe a substantial improvement in occluded head pose estimation. Also, an ablation study is conducted to ascertain the impact of the clustering term within our proposed framework.

arxiv情報

著者 José Celestino,Manuel Marques,Jacinto C. Nascimento
発行日 2024-03-29 15:57:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク