要約
教師なし個人の再識別(re-ID)は、そのスケーラビリティと実際のアプリケーションの可能性のために、ますます研究の関心を集めています。
最先端の教師なしre-IDメソッドは通常、クラスタリングベースの戦略に従います。これは、クラスタリングによって疑似ラベルを生成し、インスタンスの特徴を格納し、対照的な学習のためにクラスターの重心を表すためのメモリを維持します。
このアプローチには2つの問題があります。
まず、教師なし学習によって生成された重心は、完全なプロトタイプではない可能性があります。
画像を重心に近づけるように強制すると、クラスタリングの結果が強調され、反復中にクラスタリングエラーが蓄積される可能性があります。
第2に、以前の方法では、さまざまなトレーニングの反復で取得された特徴を利用して1つの重心を表します。これは、特徴が直接比較できないため、現在のトレーニングサンプルと一致しません。
この目的のために、確率的学習戦略を使用した教師なしre-IDアプローチを提案します。
具体的には、確率的更新メモリを採用します。この場合、クラスターからのランダムインスタンスを使用して、対照的な学習のためにクラスターレベルのメモリを更新します。
このようにして、信頼性の低い疑似ラベルによって引き起こされるトレーニングバイアスを回避するために、ランダムに選択された画像のペア間の関係が学習されます。
確率的記憶は、一貫性を保つために分類するために常に最新です。
さらに、カメラの分散の問題を軽減するために、クラスタリング中に統一された距離行列が提案されます。この場合、異なるカメラドメインからの距離バイアスが低減され、IDの分散が強調されます。
要約(オリジナル)
Unsupervised person re-identification (re-ID) has attracted increasing research interests because of its scalability and possibility for real-world applications. State-of-the-art unsupervised re-ID methods usually follow a clustering-based strategy, which generates pseudo labels by clustering and maintains a memory to store instance features and represent the centroid of the clusters for contrastive learning. This approach suffers two problems. First, the centroid generated by unsupervised learning may not be a perfect prototype. Forcing images to get closer to the centroid emphasizes the result of clustering, which could accumulate clustering errors during iterations. Second, previous methods utilize features obtained at different training iterations to represent one centroid, which is not consistent with the current training sample, since the features are not directly comparable. To this end, we propose an unsupervised re-ID approach with a stochastic learning strategy. Specifically, we adopt a stochastic updated memory, where a random instance from a cluster is used to update the cluster-level memory for contrastive learning. In this way, the relationship between randomly selected pair of images are learned to avoid the training bias caused by unreliable pseudo labels. The stochastic memory is also always up-to-date for classifying to keep the consistency. Besides, to relieve the issue of camera variance, a unified distance matrix is proposed during clustering, where the distance bias from different camera domain is reduced and the variances of identities is emphasized.
arxiv情報
著者 | Tianyang Liu,Yutian Lin,Bo Du |
発行日 | 2022-07-07 08:56:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google