View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network

要約

既存の人物再識別方法は、地面と地面の照合など、同種のカメラ全体での外観ベースの ID 関連付けにおいて目覚ましい進歩を遂げています。
ただし、より現実的なシナリオとして、異種カメラ間での空中地上人物再識別 (AGPReID) はほとんど注目されていません。
AGPReID における最も重要な課題である劇的なビューの不一致による識別アイデンティティ表現の混乱を軽減するために、シンプルかつ効果的なフレームワークとしてビュー デカップリング トランスフォーマー (VDT) が提案されています。
VDT では、ビューに関連する機能とビューに関連しない機能を分離するために、階層減法分離と直交損失という 2 つの主要なコンポーネントが設計されています。前者は VDT 内でこれら 2 つの機能を分離し、後者はこれら 2 つが独立するように制約します。
さらに、CARGO と呼ばれる大規模な AGPReID データセットも提供しています。これは、5 ~ 8 台の航空/地上カメラ、5,000 の ID、および 108,563 枚の画像で構成されています。
2 つのデータセットでの実験では、VDT が AGPReID にとって実行可能かつ効果的なソリューションであることが示され、mAP/Rank1 での以前の方法を CARGO で最大 5.0%/2.7%、AG-ReID で 3.7%/5.2% 上回り、同じ規模を維持しました。
計算の複雑さ。
私たちのプロジェクトは https://github.com/LinlyAC/VDT-AGPReID で入手できます。

要約(オリジナル)

Existing person re-identification methods have achieved remarkable advances in appearance-based identity association across homogeneous cameras, such as ground-ground matching. However, as a more practical scenario, aerial-ground person re-identification (AGPReID) among heterogeneous cameras has received minimal attention. To alleviate the disruption of discriminative identity representation by dramatic view discrepancy as the most significant challenge in AGPReID, the view-decoupled transformer (VDT) is proposed as a simple yet effective framework. Two major components are designed in VDT to decouple view-related and view-unrelated features, namely hierarchical subtractive separation and orthogonal loss, where the former separates these two features inside the VDT, and the latter constrains these two to be independent. In addition, we contribute a large-scale AGPReID dataset called CARGO, consisting of five/eight aerial/ground cameras, 5,000 identities, and 108,563 images. Experiments on two datasets show that VDT is a feasible and effective solution for AGPReID, surpassing the previous method on mAP/Rank1 by up to 5.0%/2.7% on CARGO and 3.7%/5.2% on AG-ReID, keeping the same magnitude of computational complexity. Our project is available at https://github.com/LinlyAC/VDT-AGPReID

arxiv情報

著者 Quan Zhang,Lei Wang,Vishal M. Patel,Xiaohua Xie,Jianhuang Lai
発行日 2024-03-21 16:08:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク