要約
マルチビュークラスタリング(MVC)は大きな進歩を遂げており、複数のビューから知識を学習することに専念する多くの努力がなされている。しかし、ほとんどの既存の方法は、不完全なマルチビュークラスタリングに適用できないか、追加のステップが必要であるかのいずれかである。このような制限により、質の低いクラスタリング性能と貧弱なミッシングビュー適応が生じる。さらに、ノイズや外れ値が全体のクラスタリング性能を著しく低下させる可能性があり、これらはほとんどの既存手法でうまく処理できない。さらに、既存の手法ではカテゴリ情報が必要であり、これがクラスタリング性能に深刻な影響を与える。本論文では、自己学習型対称マルチビュー確率的クラスタリング(SLS-MPC)という不完全・完全MVCのための新しい統一フレームワークを提案する。SLS-MPCは、新しい対称的マルチビュー確率推定を提案し、マルチビューのペアワイズ事後マッチング確率を、各ビューの個別分布の合成に等価的に変換する。次に、SLS-MPCは、シングルビュー、クロスビュー、マルチビューにおける整合性の観点から、各ビューの個別分布を学習するために、予備知識やハイパーパラメータを持たない新しい自己学習型確率関数を提案する。次に、パス伝播と共隣伝播によるグラフコンテキストを考慮した精密化により、ペアワイズ確率を精密化し、ノイズや外れ値の影響を緩和する。最後に、SLS-MPCは、カテゴリ情報が不要な確率論的クラスタリングアルゴリズムを提案し、反復的に結合確率を最大化することにより、クラスタリング割り当てを調整する。不完全MVCと完全MVCの複数のベンチマークを用いた広範な実験により、SLS-MPCがこれまでの最先端手法を大幅に上回ることが示された。
要約(オリジナル)
Multi-view Clustering (MVC) has achieved significant progress, with many efforts dedicated to learn knowledge from multiple views. However, most existing methods are either not applicable or require additional steps for incomplete multi-view clustering. Such a limitation results in poor-quality clustering performance and poor missing view adaptation. Besides, noise or outliers might significantly degrade the overall clustering performance, which are not handled well by most existing methods. Moreover, category information is required in most existing methods, which severely affects the clustering performance. In this paper, we propose a novel unified framework for incomplete and complete MVC named self-learning symmetric multi-view probabilistic clustering (SLS-MPC). SLS-MPC proposes a novel symmetric multi-view probability estimation and equivalently transforms multi-view pairwise posterior matching probability into composition of each view’s individual distribution, which tolerates data missing and might extend to any number of views. Then, SLS-MPC proposes a novel self-learning probability function without any prior knowledge and hyper-parameters to learn each view’s individual distribution from the aspect of consistency in single-view, cross-view and multi-view. Next, graph-context-aware refinement with path propagation and co-neighbor propagation is used to refine pairwise probability, which alleviates the impact of noise and outliers. Finally, SLS-MPC proposes a probabilistic clustering algorithm to adjust clustering assignments by maximizing the joint probability iteratively, in which category information is not required. Extensive experiments on multiple benchmarks for incomplete and complete MVC show that SLS-MPC significantly outperforms previous state-of-the-art methods.
arxiv情報
著者 | Junjie Liu,Junlong Liu,Rongxin Jiang,Xuesong Liu,Boxuan Gu,Yaowu Chen,Chen Shen,Jieping Ye |
発行日 | 2023-05-12 08:27:03+00:00 |
arxivサイト | arxiv_id(pdf) |