Towards Fully Decoupled End-to-End Person Search

要約

エンドツーエンドの人物探索は、統一されたモデルを用いて、生シーン画像中のターゲット人物の検出と再同定を共同で行うことを目的とする。検出タスクは全ての人物を統一する一方、再識別タスクは異なるアイデンティティを識別するため、最適な目的が衝突する。既存の研究では、このような競合を緩和するために、エンドツーエンドの人物探索を分離することが提案されている。しかし、これらの手法は、部分的に切り離されたモデルのため、サブタスクの1つまたは2つにおいて最適とは言えず、全体的な人物検索の性能を制限している。本論文では、最適な人物探索に向けて、人物探索を完全に切り離すことを提案する。検出と再同定サブタスクのためのエンドツーエンドモデルをインクリメンタルに構築するタスクインクリメンタルな人物探索ネットワークを提案し、これにより2つのサブタスクのモデルアーキテクチャを分離する。提案するタスク増加型ネットワークは、相反する2つのタスクのタスク増加型学習を可能にする。これにより、異なる目的に対する独立した学習が可能となり、パーソンイーチのモデルを完全に切り離すことができる。包括的な実験評価により、エンドツーエンドの人物探索における提案する完全分離モデルの有効性が実証された。

要約(オリジナル)

End-to-end person search aims to jointly detect and re-identify a target person in raw scene images with a unified model. The detection task unifies all persons while the re-id task discriminates different identities, resulting in conflict optimal objectives. Existing works proposed to decouple end-to-end person search to alleviate such conflict. Yet these methods are still sub-optimal on one or two of the sub-tasks due to their partially decoupled models, which limits the overall person search performance. In this paper, we propose to fully decouple person search towards optimal person search. A task-incremental person search network is proposed to incrementally construct an end-to-end model for the detection and re-id sub-task, which decouples the model architecture for the two sub-tasks. The proposed task-incremental network allows task-incremental training for the two conflicting tasks. This enables independent learning for different objectives thus fully decoupled the model for persons earch. Comprehensive experimental evaluations demonstrate the effectiveness of the proposed fully decoupled models for end-to-end person search.

arxiv情報

著者 Pengcheng Zhang,Xiao Bai,Jin Zheng,Xin Ning
発行日 2024-01-04 11:42:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク