Self Supervised Correlation-based Permutations for Multi-View Clustering

要約

さまざまなモダリティからの情報を融合すると、クラスタリングなどのデータ分析タスクを強化できます。
ただし、既存のマルチビュー クラスタリング (MVC) ソリューションは、特定のドメインに限定されているか、最適ではなく計算量の多い表現とクラスタリングの 2 段階の手順に依存しています。
一般データ (画像、表形式など) に対するエンドツーエンドの深層学習ベースの MVC フレームワークを提案します。
私たちのアプローチには、新しい順列ベースの正準相関目標を使用して、意味のある融合データ表現を学習することが含まれます。
同時に、複数のビューにわたって一貫した擬似ラベルを特定することで、クラスターの割り当てを学習します。
10 個の MVC ベンチマーク データセットを使用してモデルの有効性を実証します。
理論的には、モデルが教師あり線形判別分析 (LDA) 表現に近似していることを示します。
さらに、偽の疑似ラベルの注釈によって引き起こされるエラー境界を提供します。

要約(オリジナル)

Fusing information from different modalities can enhance data analysis tasks, including clustering. However, existing multi-view clustering (MVC) solutions are limited to specific domains or rely on a suboptimal and computationally demanding two-stage procedure of representation and clustering. We propose an end-to-end deep learning-based MVC framework for general data (image, tabular, etc.). Our approach involves learning meaningful fused data representations with a novel permutation-based canonical correlation objective. Concurrently, we learn cluster assignments by identifying consistent pseudo-labels across multiple views. We demonstrate the effectiveness of our model using ten MVC benchmark datasets. Theoretically, we show that our model approximates the supervised linear discrimination analysis (LDA) representation. Additionally, we provide an error bound induced by false-pseudo label annotations.

arxiv情報

著者 Ran Eisenberg,Jonathan Svirsky,Ofir Lindenbaum
発行日 2024-02-26 08:08:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク