Oracle-guided Contrastive Clustering

要約

ディープ クラスタリングは、ディープ アーキテクチャを通じてクラスタリング表現を学習することを目的としています。
既存の方法のほとんどは通常、クラスタリングのパフォーマンスを最大化するという独自の目標でクラスタリングを実行します。これは、クラスタリング タスクの個人的な要求を無視し、ガイドのないクラスタリング ソリューションをもたらします。
ただし、実際のシナリオでは、オラクルは、個別のセマンティクス (背景、色、オブジェクトなど) などの個別の基準を利用して、ラベルのないデータをクラスタ化し、パーソナライズされたクラスタリング タスクを進める傾向があります。
タスク認識クラスタリングの結果を達成するために、この研究では、オラクルにガイドされた対照的クラスタリング (OCC) が、特徴的な要求を持つオラクルに対してペアワイズ「同じクラスター」クエリを対話的に作成することによってクラスター化することが提案されています。
具体的には、能動学習に触発されて、いくつかの有益なインスタンスのペアがクエリされ、オラクルによって、ペアが目的の方向に従って同じクラスター内にあるかどうかが評価されます。
そして、これらのクエリされた同じクラスターのペアは、対照的な学習のために正のインスタンス ペアのセットを拡張し、OCC をガイドして向きを認識した特徴表現を抽出します。
したがって、独特の要求を持つオラクルによって導かれるクエリ結果は、OCC のクラスタリング結果を望ましい方向に導く可能性があります。
理論的には、アクティブ ラーニング方式でのクラスタリング リスクはより厳しい上限で与えられ、オラクルへのアクティブなクエリがクラスタリング リスクを軽減することを保証します。
実験的に、広範な結果により、OCC が特定の方向に沿って正確にクラスタリングでき、SOTA クラスタリング方法よりも大幅に優れていることが確認されています。
私たちの知る限り、これはパーソナライズされたクラスタリングを実行する最初のディープ フレームワークです。

要約(オリジナル)

Deep clustering aims to learn a clustering representation through deep architectures. Most of the existing methods usually conduct clustering with the unique goal of maximizing clustering performance, that ignores the personalized demand of clustering tasks.% and results in unguided clustering solutions. However, in real scenarios, oracles may tend to cluster unlabeled data by exploiting distinct criteria, such as distinct semantics (background, color, object, etc.), and then put forward personalized clustering tasks. To achieve task-aware clustering results, in this study, Oracle-guided Contrastive Clustering(OCC) is then proposed to cluster by interactively making pairwise “same-cluster’ queries to oracles with distinctive demands. Specifically, inspired by active learning, some informative instance pairs are queried, and evaluated by oracles whether the pairs are in the same cluster according to their desired orientation. And then these queried same-cluster pairs extend the set of positive instance pairs for contrastive learning, guiding OCC to extract orientation-aware feature representation. Accordingly, the query results, guided by oracles with distinctive demands, may drive the OCC’s clustering results in a desired orientation. Theoretically, the clustering risk in an active learning manner is given with a tighter upper bound, that guarantees active queries to oracles do mitigate the clustering risk. Experimentally, extensive results verify that OCC can cluster accurately along the specific orientation and it substantially outperforms the SOTA clustering methods as well. To the best of our knowledge, it is the first deep framework to perform personalized clustering.

arxiv情報

著者 Mengdie Wang,Liyuan Shang,Suyun Zhao,Yiming Wang,Hong Chen,Cuiping Li,Xizhao Wang
発行日 2022-11-01 12:05:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク