要約
不完全マルチビュー クラスタリング (IMVC) は、部分的にしか利用できないマルチビュー データをクラスタリングすることを目的としています。
これにより、マルチビュー情報を効果的に活用することと、ビューの欠落による影響を軽減することという 2 つの主な課題が生じます。
一般的なソリューションでは、クロスビュー対比学習と欠落ビュー回復技術が採用されています。
しかし、それらは見解間の合意のみに焦点を当てて貴重な補完情報を無視するか、監督がないために信頼性の低い復元された見解を提供するかのどちらかです。
これらの制限に対処するために、私たちは不完全なマルチビュー クラスタリングのための新しい統合されたロバスト表現学習 (URRL-IMVC) を提案します。
URRL-IMVC は、複数のビューと隣接するサンプルからの情報を統合することにより、欠落状態のビューに対して堅牢な統合埋め込みを直接学習します。
まず、クロスビュー対比学習の制限を克服するために、URL-IMVC には、マルチビュー情報を融合し、統合された埋め込みを生成するためのアテンションベースの自動エンコーダー フレームワークが組み込まれています。
第 2 に、URL-IMVC は、KNN 代入およびデータ拡張技術を通じて、ビュー欠落条件に対する統合埋め込みの堅牢性を直接強化し、明示的な欠落ビューの回復の必要性を排除します。
最後に、クラスタリング モジュールやエンコーダのカスタマイズなど、全体的なパフォーマンスをさらに向上させるための段階的な改善が導入されています。
私たちは、提案された URLL-IMVC フレームワークをさまざまなベンチマーク データセットで広範囲に評価し、その最先端のパフォーマンスを実証します。
さらに、当社の設計の有効性を検証するために、包括的なアブレーション研究が実行されます。
要約(オリジナル)
Incomplete multi-view clustering (IMVC) aims to cluster multi-view data that are only partially available. This poses two main challenges: effectively leveraging multi-view information and mitigating the impact of missing views. Prevailing solutions employ cross-view contrastive learning and missing view recovery techniques. However, they either neglect valuable complementary information by focusing only on consensus between views or provide unreliable recovered views due to the absence of supervision. To address these limitations, we propose a novel Unified and Robust Representation Learning for Incomplete Multi-View Clustering (URRL-IMVC). URRL-IMVC directly learns a unified embedding that is robust to view missing conditions by integrating information from multiple views and neighboring samples. Firstly, to overcome the limitations of cross-view contrastive learning, URRL-IMVC incorporates an attention-based auto-encoder framework to fuse multi-view information and generate unified embeddings. Secondly, URRL-IMVC directly enhances the robustness of the unified embedding against view-missing conditions through KNN imputation and data augmentation techniques, eliminating the need for explicit missing view recovery. Finally, incremental improvements are introduced to further enhance the overall performance, such as the Clustering Module and the customization of the Encoder. We extensively evaluate the proposed URRL-IMVC framework on various benchmark datasets, demonstrating its state-of-the-art performance. Furthermore, comprehensive ablation studies are performed to validate the effectiveness of our design.
arxiv情報
著者 | Ge Teng,Ting Mao,Chen Shen,Xiang Tian,Xuesong Liu,Yaowu Chen,Jieping Ye |
発行日 | 2024-07-12 09:35:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google