要約
タイトル:多次元気候データの時間的クラスタリングのための深層空間クラスタリング:時間的クラスタリングアプローチ
要約:
– 高次元の時空データをクラスタリングすることは、多数のデータ駆動型アプリケーションにとって困難な問題である。
– 既存の無監督クラスタリングの最先端技術は、異なる類似度および距離関数を使用するが、データの空間的または時間的特徴に特化している。
– 空間的および時間的特徴の共同深い表現学習に着目し、我々はDeep Spatiotemporal Clustering(DSC)を提案する。
– DSCは、畳み込みニューラルネットワークと再帰ニューラルネットワークを統合したオートエンコーダを使用して、時空データの潜在的な表現を学習する。
– DSCには、潜在表現に対するクラスタ割り当てに異常値を含む学生のt-分布を使用する固有の層も含まれている。
– クラスタリングロスとデータ再構成ロスを同時に最適化することで、アルゴリズムは徐々にクラスタリングの割り当てと低次元潜在的な特徴空間と高次元元データ空間の非線形マッピングを改善する。
– 多変量時空気候データセットを使用して、提案手法の有効性を評価したところ、従来の深層学習ベースの無監督クラスタリングアルゴリズムを上回る結果が得られた。
– さらに、提案モデルをその様々なバリアント(CNNエンコーダ、CNNオートエンコーダ、CNN-RNNエンコーダ、CNN-RNNオートエンコーダなど)と比較して、CNNとRNNの両方をオートエンコーダに使用することについて洞察を得た結果、提案手法がクラスタリング結果においてこれらのバリアントを上回ることがわかった。
要約(オリジナル)
Clustering high-dimensional spatiotemporal data using an unsupervised approach is a challenging problem for many data-driven applications. Existing state-of-the-art methods for unsupervised clustering use different similarity and distance functions but focus on either spatial or temporal features of the data. Concentrating on joint deep representation learning of spatial and temporal features, we propose Deep Spatiotemporal Clustering (DSC), a novel algorithm for the temporal clustering of high-dimensional spatiotemporal data using an unsupervised deep learning method. Inspired by the U-net architecture, DSC utilizes an autoencoder integrating CNN-RNN layers to learn latent representations of the spatiotemporal data. DSC also includes a unique layer for cluster assignment on latent representations that uses the Student’s t-distribution. By optimizing the clustering loss and data reconstruction loss simultaneously, the algorithm gradually improves clustering assignments and the nonlinear mapping between low-dimensional latent feature space and high-dimensional original data space. A multivariate spatiotemporal climate dataset is used to evaluate the efficacy of the proposed method. Our extensive experiments show our approach outperforms both conventional and deep learning-based unsupervised clustering algorithms. Additionally, we compared the proposed model with its various variants (CNN encoder, CNN autoencoder, CNN-RNN encoder, CNN-RNN autoencoder, etc.) to get insight into using both the CNN and RNN layers in the autoencoder, and our proposed technique outperforms these variants in terms of clustering results.
arxiv情報
著者 | Omar Faruque,Francis Ndikum Nji,Mostafa Cham,Rohan Mandar Salvi,Xue Zheng,Jianwu Wang |
発行日 | 2023-04-27 21:45:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI