Asymptotic Gaussian Fluctuations of Eigenvectors in Spectral Clustering

要約

スペクトル クラスタリングのパフォーマンスは、類似度行列の固有ベクトルのエントリの変動に依存していますが、これまで特徴付けられていませんでした。
この手紙では、一般的なスパイクランダム行列モデルの信号 $+$ ノイズ構造が、対応するグラム核行列の固有ベクトルに変換され、そのエントリの変動が大次元領域でガウス型であることを示します。
この CLT のような結果は、スペクトル クラスタリングの分類パフォーマンスを正確に予測するために欠けていた最後の部分でした。
提案された証明は非常に一般的であり、ノイズの回転不変性のみに依存しています。
合成データと実データの数値実験は、この現象の普遍性を示しています。

要約(オリジナル)

The performance of spectral clustering relies on the fluctuations of the entries of the eigenvectors of a similarity matrix, which has been left uncharacterized until now. In this letter, it is shown that the signal $+$ noise structure of a general spike random matrix model is transferred to the eigenvectors of the corresponding Gram kernel matrix and the fluctuations of their entries are Gaussian in the large-dimensional regime. This CLT-like result was the last missing piece to precisely predict the classification performance of spectral clustering. The proposed proof is very general and relies solely on the rotational invariance of the noise. Numerical experiments on synthetic and real data illustrate the universality of this phenomenon.

arxiv情報

著者 Hugo Lebeau,Florent Chatelain,Romain Couillet
発行日 2024-02-19 17:25:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.PR, stat.ML パーマリンク