要約
ラベル情報なしで表現と意味的クラスタリングを学習するディープクラスタリングは、ディープラーニングベースのアプローチに大きな課題を投げかけている。近年著しい進歩が見られるものの、既存の手法の多くは一様に分布したデータセットに着目しており、その手法の実用的な適用可能性を著しく制限している。本稿では、基礎となるクラスが不均衡分布を示す、深層不均衡クラスタリングと名付けられた、より実用的な問題設定を提案する。この課題に対処するために、我々は新しい最適輸送ベースの擬似ラベル学習フレームワークを導入する。本フレームワークは、擬似ラベル生成を意味正則化漸進的部分最適輸送(Semantic-regularized Progressive Partial Optimal Transport: SP$^2$OT)問題として定式化し、いくつかの事前分布と意味関係制約の下で、各サンプルを不均衡クラスタに漸進的に輸送し、高品質で不均衡を考慮した擬似ラベルを生成する。SP$^2$OTを解くために、我々はマジョリゼーション-最小化に基づく最適化アルゴリズムを開発する。より正確には、SP$^2$OT問題を漸進的部分最適輸送問題に再定式化するために、マジョリゼーション戦略を用いる。人間がキュレーションしたロングテールのCIFAR100、難易度の高いImageNet-R、iNaturalist2018データセットの大規模な部分集合など、様々なデータセットを用いた実験により、本手法の優位性を実証する。
要約(オリジナル)
Deep clustering, which learns representation and semantic clustering without labels information, poses a great challenge for deep learning-based approaches. Despite significant progress in recent years, most existing methods focus on uniformly distributed datasets, significantly limiting the practical applicability of their methods. In this paper, we propose a more practical problem setting named deep imbalanced clustering, where the underlying classes exhibit an imbalance distribution. To address this challenge, we introduce a novel optimal transport-based pseudo-label learning framework. Our framework formulates pseudo-label generation as a Semantic-regularized Progressive Partial Optimal Transport (SP$^2$OT) problem, which progressively transports each sample to imbalanced clusters under several prior distribution and semantic relation constraints, thus generating high-quality and imbalance-aware pseudo-labels. To solve SP$^2$OT, we develop a Majorization-Minimization-based optimization algorithm. To be more precise, we employ the strategy of majorization to reformulate the SP$^2$OT problem into a Progressive Partial Optimal Transport problem, which can be transformed into an unbalanced optimal transport problem with augmented constraints and can be solved efficiently by a fast matrix scaling algorithm. Experiments on various datasets, including a human-curated long-tailed CIFAR100, challenging ImageNet-R, and large-scale subsets of fine-grained iNaturalist2018 datasets, demonstrate the superiority of our method.
arxiv情報
著者 | Chuyu Zhang,Hui Ren,Xuming He |
発行日 | 2024-04-04 13:46:52+00:00 |
arxivサイト | arxiv_id(pdf) |