An Improved Baseline Framework for Pose Estimation Challenge at ECCV 2022 Visual Perception for Navigation in Human Environments Workshop

要約

このテクニカル レポートでは、ECCV 2022 Visual Perception for Navigation in Human Environments ワークショップでの姿勢推定の課題に対する当社の第一位のソリューションについて説明します。
この課題では、野生で合成されたパノラマ画像から人間のポーズを推定することを目指しています。
私たちの方法は、人間検出のための Faster R-CNN と、人間の姿勢推定のための HRNet に基づいて構築されています。
JRDB-Pose データセットの技術的な詳細と、いくつかの実験結果について説明します。
コンテストでは、JRDB-Pose のテスト セットで 0.303 $\text{OSPA}_{\text{IOU}}$ と 64.047\% $\text{AP}_{\text{0.5}}$ を達成しました。

要約(オリジナル)

This technical report describes our first-place solution to the pose estimation challenge at ECCV 2022 Visual Perception for Navigation in Human Environments Workshop. In this challenge, we aim to estimate human poses from in-the-wild stitched panoramic images. Our method is built based on Faster R-CNN for human detection, and HRNet for human pose estimation. We describe technical details for the JRDB-Pose dataset, together with some experimental results. In the competition, we achieved 0.303 $\text{OSPA}_{\text{IOU}}$ and 64.047\% $\text{AP}_{\text{0.5}}$ on the test set of JRDB-Pose.

arxiv情報

著者 Jiajun Fu,Yonghao Dang,Ruoqi Yin,Shaojie Zhang,Feng Zhou,Wending Zhao,Jianqin Yin
発行日 2023-03-13 14:09:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク