Deep Multi-Task Networks For Occluded Pedestrian Pose Estimation

要約

歩行者姿勢推定に関する既存の研究のほとんどは、関連する自動車データセットにおいて、オクルージョン部分のアノテーションが利用できないため、オクルージョン歩行者の姿勢を推定することを考慮していません。例えば、自動車シーンにおける歩行者検出のための有名なデータセットであるCityPersonsは、姿勢のアノテーションを提供していないが、自動車以外のデータセットであるMS-COCOは、人間の姿勢推定を含んでいる。本研究では、この2つの分布に対して別々に行われる検出タスクとインスタンス分割タスクを通じて、歩行者の特徴を抽出するマルチタスクフレームワークを提案する。その後、エンコーダが教師無しインスタンスレベル領域適応法を用いて、両者の分布から歩行者インスタンスに固有のポーズ特徴を学習する。提案するフレームワークは、姿勢推定、歩行者検出、インスタンス分割の性能を向上させることができます。

要約(オリジナル)

Most of the existing works on pedestrian pose estimation do not consider estimating the pose of an occluded pedestrian, as the annotations of the occluded parts are not available in relevant automotive datasets. For example, CityPersons, a well-known dataset for pedestrian detection in automotive scenes does not provide pose annotations, whereas MS-COCO, a non-automotive dataset, contains human pose estimation. In this work, we propose a multi-task framework to extract pedestrian features through detection and instance segmentation tasks performed separately on these two distributions. Thereafter, an encoder learns pose specific features using an unsupervised instance-level domain adaptation method for the pedestrian instances from both distributions. The proposed framework has improved state-of-the-art performances of pose estimation, pedestrian detection, and instance segmentation.

arxiv情報

著者 Arindam Das,Sudip Das,Ganesh Sistu,Jonathan Horgan,Ujjwal Bhattacharya,Edward Jones,Martin Glavin,Ciarán Eising
発行日 2022-08-08 14:03:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク