要約
部品の特徴学習は、車両の再識別におけるきめの細かいセマンティック理解にとって重要なテクノロジーです。
ただし、最近の教師なし再識別作業では、パーツの特徴とグローバルな特徴を直接モデリングすると、深刻な勾配崩壊の問題が発生します。
この問題に対処するために、このホワイト ペーパーでは、クラスター機能を活用してパーツ機能とグローバル機能を橋渡しする新しいトリプレット対照学習フレームワーク (TCL) を提案します。
具体的には、TCL は、属性に従って特徴を格納する 3 つのメモリ バンクを考案し、プロキシ コントラスト ロス (PCL) を提案して、隣接するメモリ バンク間で対照的な学習を行います。
クラスターとグローバルの関連付け。
クラスタ メモリ バンクはすべてのインスタンス フィーチャを処理するため、それらを識別可能なフィーチャ表現にまとめることができます。
インスタンス情報を深く活用するために、TCL は 2 つの追加の損失関数を提案しています。
クラス間インスタンスの場合、ハイブリッド コントラスト損失 (HCL) は、正のクラスターの特徴に近づき、すべての負のインスタンスの特徴を残すことによって、サンプル相関を再定義します。
クラス内インスタンスの場合、重み付けされた正則化クラスター コントラスト損失 (WRCCL) は、インスタンスの類似性に従って誤ってラベル付けされた画像にペナルティを課すことにより、疑似ラベルを改良します。
広範な実験により、TCL は多くの最先端の教師なし車両再識別アプローチよりも優れていることが示されています。
コードは https://github.com/muzishen/TCL で入手できます。
要約(オリジナル)
Part feature learning is a critical technology for finegrained semantic understanding in vehicle re-identification. However, recent unsupervised re-identification works exhibit serious gradient collapse issues when directly modeling the part features and global features. To address this problem, in this paper, we propose a novel Triplet Contrastive Learning framework (TCL) which leverages cluster features to bridge the part features and global features. Specifically, TCL devises three memory banks to store the features according to their attributes and proposes a proxy contrastive loss (PCL) to make contrastive learning between adjacent memory banks, thus presenting the associations between the part and global features as a transition of the partcluster and cluster-global associations. Since the cluster memory bank deals with all the instance features, it can summarize them into a discriminative feature representation. To deeply exploit the instance information, TCL proposes two additional loss functions. For the inter-class instance, a hybrid contrastive loss (HCL) re-defines the sample correlations by approaching the positive cluster features and leaving the all negative instance features. For the intra-class instances, a weighted regularization cluster contrastive loss (WRCCL) refines the pseudo labels by penalizing the mislabeled images according to the instance similarity. Extensive experiments show that TCL outperforms many state-of-the-art unsupervised vehicle re-identification approaches. The code will be available at https://github.com/muzishen/TCL.
arxiv情報
著者 | Fei Shen,Xiaoyu Du,Liyan Zhang,Jinhui Tang |
発行日 | 2023-01-23 15:52:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google