要約
人物の再識別は、ビデオベースの人間の行動を分析するための重要な技術です。
ただし、トレーニングデータとは異なるドメインのパフォーマンスが低下するため、実際の状況ではその適用は依然として困難です。
ここでは、ドメインギャップを縮小するための環境に制約された適応ネットワークを提案します。
このネットワークは、マルチカメラの制約を課すことにより、自己トレーニング スキームを介して推定された疑似ラベルを改良します。
提案された方法は、環境から得られた人物識別ラベルのない人物ペア情報をモデルトレーニングに組み込みます。
また、パフォーマンス向上に貢献する人物をペアから適切に選択する手法を開発します。
パブリック データセットとプライベート データセットを使用してネットワークのパフォーマンスを評価し、カメラ ビューが重複しているドメインでパフォーマンスが最先端の方法を上回っていることを確認します。
私たちの知る限り、これは実際の環境で取得できるマルチカメラの制約を伴うドメイン適応学習に関する最初の研究です。
要約(オリジナル)
Person re-identification is a key technology for analyzing video-based human behavior; however, its application is still challenging in practical situations due to the performance degradation for domains different from those in the training data. Here, we propose an environment-constrained adaptive network for reducing the domain gap. This network refines pseudo-labels estimated via a self-training scheme by imposing multi-camera constraints. The proposed method incorporates person-pair information without person identity labels obtained from the environment into the model training. In addition, we develop a method that appropriately selects a person from the pair that contributes to the performance improvement. We evaluate the performance of the network using public and private datasets and confirm the performance surpasses state-of-the-art methods in domains with overlapping camera views. To the best of our knowledge, this is the first study on domain-adaptive learning with multi-camera constraints that can be obtained in real environments.
arxiv情報
著者 | S. Takeuchi,F. Li,S. Iwasaki,J. Ning,G. Suzuki |
発行日 | 2022-10-25 13:12:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google