Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering

要約

教師なしハッシュ化手法は、大規模データの爆発的な増加に伴い、コンパクトなバイナリコードを学習することでストレージと計算量を大幅に削減できる手法として広く注目されている。既存の教師なしハッシュ化手法は、サンプルからの貴重な情報を利用しようとするものであり、ラベル付けされていないサンプルの局所的な幾何構造を考慮することができない。さらに、オートエンコーダーに基づくハッシングは、入力データとバイナリコードの間の再構成損失を最小化することを目的としているが、これは複数のソースデータの潜在的な一貫性と補完性を無視するものである。上記の問題を解決するために、我々は、低ランク制約を持つ親和性グラフを動的に学習し、オートエンコーダーと親和性グラフの協調学習を採用して統一的なバイナリコードを学習する、マルチビューバイナリクラスタリングのためのオートエンコーダーに基づくハッシングアルゴリズム、Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering (GCAE)を提案する。具体的には、マルチビューデータから幾何学的情報を抽出することができる低ランク制約のマルチビュー親和性グラフ学習モデルを提案する。そして、複数の親和性グラフを連携させるエンコーダ・デコーダのパラダイムを設計し、統一的なバイナリコードを効率的に学習することが可能である。特に、量子化誤差を低減するために、バイナリコードに非相関制約とコードバランス制約を課す。最後に、マルチビュークラスタリングの結果を得るために、交互反復最適化スキームを利用する。本アルゴリズムの有効性と他の最先端技術に対する優れた性能を明らかにするために、$5$の公共データセットに対する広範な実験結果が提供される。

要約(オリジナル)

Unsupervised hashing methods have attracted widespread attention with the explosive growth of large-scale data, which can greatly reduce storage and computation by learning compact binary codes. Existing unsupervised hashing methods attempt to exploit the valuable information from samples, which fails to take the local geometric structure of unlabeled samples into consideration. Moreover, hashing based on auto-encoders aims to minimize the reconstruction loss between the input data and binary codes, which ignores the potential consistency and complementarity of multiple sources data. To address the above issues, we propose a hashing algorithm based on auto-encoders for multi-view binary clustering, which dynamically learns affinity graphs with low-rank constraints and adopts collaboratively learning between auto-encoders and affinity graphs to learn a unified binary code, called Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering (GCAE). Specifically, we propose a multi-view affinity graphs learning model with low-rank constraint, which can mine the underlying geometric information from multi-view data. Then, we design an encoder-decoder paradigm to collaborate the multiple affinity graphs, which can learn a unified binary code effectively. Notably, we impose the decorrelation and code balance constraints on binary codes to reduce the quantization errors. Finally, we utilize an alternating iterative optimization scheme to obtain the multi-view clustering results. Extensive experimental results on $5$ public datasets are provided to reveal the effectiveness of the algorithm and its superior performance over other state-of-the-art alternatives.

arxiv情報

著者 Huibing Wang,Mingze Yao,Guangqi Jiang,Zetian Mi,Xianping Fu
発行日 2023-01-06 12:43:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク