要約
概念因数分解 (CF) は、表現学習の新しいパラダイムとして、マルチビュー クラスタリング タスクにおいて優れたパフォーマンスを実証しています。
従来の行列因数分解手法によって課せられる非負性制約などの制限を克服し、カーネル手法を利用してデータの基礎となる構造を捕捉する潜在表現を学習することで、データ表現を向上させます。
しかし、既存のマルチビュー概念因数分解手法では、現実世界のマルチビュー データに固有の限られたラベル付き情報を考慮できません。
これは多くの場合、重大なパフォーマンスの低下につながります。
これらの制限を克服するために、SMVCF と呼ばれる新しい半教師ありマルチビュー概念因数分解モデルを提案します。
SMVCF モデルでは、まず従来のシングルビュー CF をマルチビュー バージョンに拡張し、複数のビューにわたる補完的な情報をより効果的に探索できるようにします。
次に、マルチビュー CF、ラベル伝播、および多様体学習を統一フレームワークに統合して、データに存在する貴重な情報を活用して組み込みます。
さらに、クラスタリング プロセスにおけるさまざまなビューの重要性のバランスをとるために、適応重みベクトルが導入されています。
さらに、SMVCF モデルに特化したターゲットを絞った最適化手法を開発します。
最後に、SMVCF のパフォーマンスを評価するために、さまざまなラベル比を持つ 4 つの多様なデータセットに対して広範な実験を実施します。
実験結果は、マルチビュー クラスタリング タスクにおける提案手法の有効性と優位性を示しています。
要約(オリジナル)
Concept Factorization (CF), as a novel paradigm of representation learning, has demonstrated superior performance in multi-view clustering tasks. It overcomes limitations such as the non-negativity constraint imposed by traditional matrix factorization methods and leverages kernel methods to learn latent representations that capture the underlying structure of the data, thereby improving data representation. However, existing multi-view concept factorization methods fail to consider the limited labeled information inherent in real-world multi-view data. This often leads to significant performance loss. To overcome these limitations, we propose a novel semi-supervised multi-view concept factorization model, named SMVCF. In the SMVCF model, we first extend the conventional single-view CF to a multi-view version, enabling more effective exploration of complementary information across multiple views. We then integrate multi-view CF, label propagation, and manifold learning into a unified framework to leverage and incorporate valuable information present in the data. Additionally, an adaptive weight vector is introduced to balance the importance of different views in the clustering process. We further develop targeted optimization methods specifically tailored for the SMVCF model. Finally, we conduct extensive experiments on four diverse datasets with varying label ratios to evaluate the performance of SMVCF. The experimental results demonstrate the effectiveness and superiority of our proposed approach in multi-view clustering tasks.
arxiv情報
著者 | Qi Jiang,Guoxu Zhou,Qibin Zhao |
発行日 | 2023-07-03 10:50:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google