要約
このテクニカル レポートでは、ECCV 2022 Visual Perception for Navigation in Human Environments ワークショップでの姿勢推定の課題に対する当社の第一位のソリューションについて説明します。
この課題では、野生で合成されたパノラマ画像から人間のポーズを推定することを目指しています。
私たちの方法は、人間検出のための Faster R-CNN と、人間の姿勢推定のための HRNet に基づいて構築されています。
JRDB-Pose データセットの技術的な詳細と、いくつかの実験結果について説明します。
コンテストでは、JRDB-Pose のテスト セットで 0.303 $\text{OSPA}_{\text{IOU}}$ と 64.047\% $\text{AP}_{\text{0.5}}$ を達成しました。
要約(オリジナル)
This technical report describes our first-place solution to the pose estimation challenge at ECCV 2022 Visual Perception for Navigation in Human Environments Workshop. In this challenge, we aim to estimate human poses from in-the-wild stitched panoramic images. Our method is built based on Faster R-CNN for human detection, and HRNet for human pose estimation. We describe technical details for the JRDB-Pose dataset, together with some experimental results. In the competition, we achieved 0.303 $\text{OSPA}_{\text{IOU}}$ and 64.047\% $\text{AP}_{\text{0.5}}$ on the test set of JRDB-Pose.
arxiv情報
著者 | Jiajun Fu,Yonghao Dang,Ruoqi Yin,Shaojie Zhang,Feng Zhou,Wending Zhao,Jianqin Yin |
発行日 | 2023-03-13 14:09:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google