Exploring Deep Models for Practical Gait Recognition

要約

歩行認識は、遠距離から人物を識別するためのビジョン技術として急速に発展している。先行研究では、比較的小さく浅いニューラルネットワークを使用して微妙な歩容の特徴を抽出し、屋内環境において印象的な成功を収めています。しかしながら、これらの既存手法は、新たに公開された実環境の歩行データセットに適用した場合、満足のいく結果が得られないことが実験で明らかになりました。本論文では、最先端の屋外歩行認識のためのディープモデルを構築する方法を探求する統一的な視点を提示し、従来のCNNベースと新興のTransformerベースのアーキテクチャを含む。その結果、識別可能な歩行表現学習のために、適切なネットワーク容量、明示的な時間モデル化、および深層トランスフォーマー構造の重要性を強調する。私たちが提案するCNNベースのDeepGaitV2シリーズとTransformerベースのSwinGaitシリーズは、屋外シナリオにおいて、困難なGREWデータセットで多くの最先端手法と比較して、約+30%のランク1精度という著しい性能向上を示しています。本研究により、歩行認識の研究・応用がさらに進むことが期待されます。コードは https://github.com/ShiqiYu/OpenGait で公開される予定です。

要約(オリジナル)

Gait recognition is a rapidly advancing vision technique for person identification from a distance. Prior studies predominantly employed relatively small and shallow neural networks to extract subtle gait features, achieving impressive successes in indoor settings. Nevertheless, experiments revealed that these existing methods mostly produce unsatisfactory results when applied to newly released in-the-wild gait datasets. This paper presents a unified perspective to explore how to construct deep models for state-of-the-art outdoor gait recognition, including the classical CNN-based and emerging Transformer-based architectures. Consequently, we emphasize the importance of suitable network capacity, explicit temporal modeling, and deep transformer structure for discriminative gait representation learning. Our proposed CNN-based DeepGaitV2 series and Transformer-based SwinGait series exhibit significant performance gains in outdoor scenarios, \textit{e.g.}, about +30\% rank-1 accuracy compared with many state-of-the-art methods on the challenging GREW dataset. This work is expected to further boost the research and application of gait recognition. Code will be available at https://github.com/ShiqiYu/OpenGait.

arxiv情報

著者 Chao Fan,Saihui Hou,Yongzhen Huang,Shiqi Yu
発行日 2023-03-06 17:19:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク