Snapshot Spectral Clustering — a costless approach to deep clustering ensembles generation

要約

人工知能の目覚ましい進歩にも関わらず、教師なしの方法で大量のデータセットから学習することは依然として大きな課題です。
従来のクラスタリング アルゴリズムでは、特に疎な高次元空間を考慮すると、大規模なデータセット内の複雑な依存関係を検出できないことがよくあります。
ただし、深層学習技術は、大量のデータを処理する場合に成功し、基礎となる情報を失うことなくデータの次元を効率的に削減できることが証明されました。
深層学習とクラスタリングを組み合わせることで、いくつかの興味深い進歩がすでに行われています。
それでも、ディープ ニューラル ネットワークによって生成されたデータの複数のビューを組み合わせてクラスタリングの結果を強化するというアイデアは、まだ十分に検討されていないようです。
この論文は、この方向性を調査し、ディープ ニューラル ネットワーク、クラスタリング手法、アンサンブル学習手法の間のギャップを埋めることを目的としています。
この目標を達成するために、私たちは新しいディープ クラスタリング アンサンブル手法であるスナップショット スペクトル クラスタリングを提案します。これは、アンサンブル作成の計算コストを最小限に抑えながら、複数のデータ ビューの結合による利益を最大化するように設計されています。
このホワイトペーパーで説明されている比較分析と実験は、提案された概念を証明する一方、実施されたハイパーパラメータ調査は、適切な値を選択する際に従うべき貴重な直観を提供します。

要約(オリジナル)

Despite tremendous advancements in Artificial Intelligence, learning from large sets of data in an unsupervised manner remains a significant challenge. Classical clustering algorithms often fail to discover complex dependencies in large datasets, especially considering sparse, high-dimensional spaces. However, deep learning techniques proved to be successful when dealing with large quantities of data, efficiently reducing their dimensionality without losing track of underlying information. Several interesting advancements have already been made to combine deep learning and clustering. Still, the idea of enhancing the clustering results by combining multiple views of the data generated by deep neural networks appears to be insufficiently explored yet. This paper aims to investigate this direction and bridge the gap between deep neural networks, clustering techniques and ensemble learning methods. To achieve this goal, we propose a novel deep clustering ensemble method – Snapshot Spectral Clustering, designed to maximize the gain from combining multiple data views while minimizing the computational costs of creating the ensemble. Comparative analysis and experiments described in this paper prove the proposed concept, while the conducted hyperparameter study provides a valuable intuition to follow when selecting proper values.

arxiv情報

著者 Adam Piróg,Halina Kwaśnicka
発行日 2023-07-17 16:01:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク