Google Coral-based edge computing person reidentification using human parsing combined with analytical method

要約

個人の再識別 (re-ID) は、科学と社会保障にとって重要であるため、コンピューター ビジョンの最も重要な応用分野の 1 つになりつつあります。
カメラ システムのサイズと規模が非常に大きいため、分析の少なくとも一部をカメラで実行できるエッジ コンピューティングの再 ID アプリケーションを開発することは有益です。
ただし、従来の再 ID は、ディープ ラーニング (DL) の計算負荷の高いモデルに大きく依存しており、エッジ コンピューティングには容易に適用できません。
このホワイト ペーパーでは、最近提案された再 ID 手法を適応させます。これは、DL ヒューマン パーシングと分析的特徴抽出およびランキング スキームを組み合わせて、エッジ コンピューティングの再 ID により適したものにします。
まず、ResNet101、ResNet18、MobileNetV2、および OSNet バックボーンを使用するパーサーを比較し、コンパクトなバックボーンを使用して十分な精度で解析を実行できることを示します。
次に、パーサーを Google Coral Dev Board のテンソル プロセッシング ユニット (TPU) に転送し、それがポータブル エッジ コンピューティングの再 ID ステーションとして機能できることを示します。
また、Coral CPU に再 ID 手法の分析部分を実装して、完全な再 ID サイクルを確実に実行できるようにします。
定量分析では、パーサー バックボーンに応じて、GPU と Coral TPU での推論速度、解析マスク、再 ID 精度を比較します。
また、主にポータブル デバイスのメモリとストレージ スペースに関連する既知の制限を考慮して、再 ID におけるエッジ コンピューティングの可能なアプリケーション シナリオについても説明します。

要約(オリジナル)

Person reidentification (re-ID) is becoming one of the most significant application areas of computer vision due to its importance for science and social security. Due to enormous size and scale of camera systems it is beneficial to develop edge computing re-ID applications where at least part of the analysis could be performed by the cameras. However, conventional re-ID relies heavily on deep learning (DL) computationally demanding models which are not readily applicable for edge computing. In this paper we adapt a recently proposed re-ID method that combines DL human parsing with analytical feature extraction and ranking schemes to be more suitable for edge computing re-ID. First, we compare parsers that use ResNet101, ResNet18, MobileNetV2, and OSNet backbones and show that parsing can be performed using compact backbones with sufficient accuracy. Second, we transfer parsers to tensor processing unit (TPU) of Google Coral Dev Board and show that it can act as a portable edge computing re-ID station. We also implement the analytical part of re-ID method on Coral CPU to ensure that it can perform a complete re-ID cycle. For quantitative analysis we compare inference speed, parsing masks, and re-ID accuracy on GPU and Coral TPU depending on parser backbone. We also discuss possible application scenarios of edge computing in re-ID taking into account known limitations mainly related to memory and storage space of portable devices.

arxiv情報

著者 Nikita Gabdullin,Anton Raskovalov
発行日 2022-09-22 14:15:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク