Approximate spectral clustering density-based similarity for noisy datasets

要約

近似スペクトル クラスタリング (ASC) は、スペクトル クラスタリング (SC) の重い計算要求を克服するために開発されました。
非凸クラスターを予測する SC 能力を維持します。
これには前処理ステップが含まれるため、ASC はグラフのエッジに重みを割り当てる新しい類似度を定義します。
接続マトリックス (CONN) は、ASC のグラフを作成するための効率的な類似度測定です。
2 つの頂点間の重みを、ベクトル量子化トレーニング中にそれらに割り当てられたポイントの数として定義します。
ただし、この関係は無向であり、どの頂点がそのエッジにより多く寄与しているかが明確ではありません。
また、CONN はクラスター間のノイズ密度によってだまされる可能性があります。
DCONN という名前の CONN の有向バージョンを定義して、エッジへの頂点の寄与に関する洞察を得ました。
また、CONN エッジが潜在的なクラスターを強調表示するように、フィルタリング スキームを提供しました。
実験により、提案されたフィルタリングは、CONN がノイズを許容できない場合に非常に効率的であることが明らかになりました。

要約(オリジナル)

Approximate spectral clustering (ASC) was developed to overcome heavy computational demands of spectral clustering (SC). It maintains SC ability in predicting non-convex clusters. Since it involves a preprocessing step, ASC defines new similarity measures to assign weights on graph edges. Connectivity matrix (CONN) is an efficient similarity measure to construct graphs for ASC. It defines the weight between two vertices as the number of points assigned to them during vector quantization training. However, this relationship is undirected, where it is not clear which of the vertices is contributing more to that edge. Also, CONN could be tricked by noisy density between clusters. We defined a directed version of CONN, named DCONN, to get insights on vertices contributions to edges. Also, we provided filtering schemes to ensure CONN edges are highlighting potential clusters. Experiments reveal that the proposed filtering was highly efficient when noise cannot be tolerated by CONN.

arxiv情報

著者 Mashaan Alshammari,Masahiro Takatsuka
発行日 2023-02-22 11:33:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR, cs.LG, cs.NE パーマリンク