One-step Multi-view Clustering with Diverse Representation

要約

マルチビュー クラスタリングは、ビュー間で一貫した補完的な情報を利用できるため、幅広い注目を集めています。
最近では大きな進歩が見られますが、既存の手法のほとんどは非常に複雑であるため、大規模なタスクに適用することができません。
行列分解によるマルチビュー クラスタリングは、この問題に対処する代表的な方法です。
ただし、そのほとんどはデータ行列を固定次元にマッピングするため、モデルの表現力が制限されます。
さらに、さまざまな手法は 2 段階のプロセス、つまりマルチモーダル学習とそれに続く $k$-means の影響を受け、必然的に次善のクラスタリング結果が生じます。
これを考慮して、マルチビュー学習と$k$-meansを統合フレームワークに組み込んだ、多様な表現方法を備えたワンステップマルチビュークラスタリングを提案します。
具体的には、まずオリジナルのデータ行列をさまざまな潜在空間に射影して包括的な情報を取得し、自己教師付きでそれらに自動重み付けを行います。
次に、さまざまな次元で情報行列を直接使用して、コンセンサスのある離散クラスタリング ラベルを取得します。
表現学習とクラスタリングの統合された作業により、最終結果の品質が向上します。
さらに、結果として生じる問題を解決するために、収束が実証された効率的な最適化アルゴリズムを開発します。
さまざまなデータセットに対する包括的な実験により、私たちが提案した方法の有望なクラスタリングパフォーマンスが実証されました。

要約(オリジナル)

Multi-view clustering has attracted broad attention due to its capacity to utilize consistent and complementary information among views. Although tremendous progress has been made recently, most existing methods undergo high complexity, preventing them from being applied to large-scale tasks. Multi-view clustering via matrix factorization is a representative to address this issue. However, most of them map the data matrices into a fixed dimension, limiting the model’s expressiveness. Moreover, a range of methods suffers from a two-step process, i.e., multimodal learning and the subsequent $k$-means, inevitably causing a sub-optimal clustering result. In light of this, we propose a one-step multi-view clustering with diverse representation method, which incorporates multi-view learning and $k$-means into a unified framework. Specifically, we first project original data matrices into various latent spaces to attain comprehensive information and auto-weight them in a self-supervised manner. Then we directly use the information matrices under diverse dimensions to obtain consensus discrete clustering labels. The unified work of representation learning and clustering boosts the quality of the final results. Furthermore, we develop an efficient optimization algorithm with proven convergence to solve the resultant problem. Comprehensive experiments on various datasets demonstrate the promising clustering performance of our proposed method.

arxiv情報

著者 Xinhang Wan,Jiyuan Liu,Xinwang Liu,Siwei Wang,Yi Wen,Tianjiao Wan,Li Shen,En Zhu
発行日 2023-06-27 13:52:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク