UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval

要約

歩行者のソフトバイオメトリクス属性を認識することは、ビデオ監視やファッション検索に不可欠である。最近の研究では、単一のデータセットで有望な結果を示している。しかしながら、現在のデータセットには強いバイアスや様々な属性が存在するため、異なる属性分布、視点、様々な照明、低解像度におけるこれらの手法の汎化能力は、ほとんど理解されていないのが現状である。このギャップを埋め、体系的な調査を支援するために、我々はUPAR(Unified Person Attribute Recognition Dataset)を発表する。このデータセットは、よく知られた4つの人物属性認識データセットに基づいています。本データセットは、PA100K、PETA、RAPv2、Market1501の4つの著名な人物属性認識データセットをベースにしています。我々は、データセット間で12の属性カテゴリにまたがる40の重要なバイナリ属性を調和させるために、3,300の追加アノテーションを提供することによって、これらのデータセットを統一する。これにより、一般化可能な歩行者属性認識と属性に基づく人物検索の研究を初めて可能にした。画像分布、歩行者の姿勢、スケール、オクルージョンなどの大きなばらつきがあるため、既存のアプローチは精度と効率の両面で大きな課題を抱えています。さらに、正則化手法の徹底的な分析に基づき、PARおよび属性に基づく人物検索のための強力なベースラインを開発する。我々のモデルは、PA100k、PETA、RAPv2、Market1501-Attributes、UPARにおいて、分野横断的かつ特殊化した設定で最先端の性能を達成する。我々は、UPARと我々の強力なベースラインが人工知能コミュニティに貢献し、大規模で一般化可能な属性認識システムの研究を促進すると信じている。

要約(オリジナル)

Recognizing soft-biometric pedestrian attributes is essential in video surveillance and fashion retrieval. Recent works show promising results on single datasets. Nevertheless, the generalization ability of these methods under different attribute distributions, viewpoints, varying illumination, and low resolutions remains rarely understood due to strong biases and varying attributes in current datasets. To close this gap and support a systematic investigation, we present UPAR, the Unified Person Attribute Recognition Dataset. It is based on four well-known person attribute recognition datasets: PA100K, PETA, RAPv2, and Market1501. We unify those datasets by providing 3,3M additional annotations to harmonize 40 important binary attributes over 12 attribute categories across the datasets. We thus enable research on generalizable pedestrian attribute recognition as well as attribute-based person retrieval for the first time. Due to the vast variance of the image distribution, pedestrian pose, scale, and occlusion, existing approaches are greatly challenged both in terms of accuracy and efficiency. Furthermore, we develop a strong baseline for PAR and attribute-based person retrieval based on a thorough analysis of regularization methods. Our models achieve state-of-the-art performance in cross-domain and specialization settings on PA100k, PETA, RAPv2, Market1501-Attributes, and UPAR. We believe UPAR and our strong baseline will contribute to the artificial intelligence community and promote research on large-scale, generalizable attribute recognition systems.

arxiv情報

著者 Andreas Specker,Mickael Cormier,Jürgen Beyerer
発行日 2022-09-06 14:20:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク