Diffusion-based Semi-supervised Spectral Algorithm for Regression on Manifolds

要約

我々は、高次元データ、特に低次元多様体内に埋め込まれたデータの回帰分析に取り組むための、新しい拡散ベースのスペクトル アルゴリズムを導入します。
従来のスペクトル アルゴリズムは、主に所定のカーネル関数に依存しているため、このような状況では不十分であることが多く、多様体ベースのデータに固有の複雑な構造に適切に対処できません。
グラフのラプラシアン近似を採用することにより、私たちの方法はヒート カーネルの局所推定特性を使用し、この障害を克服するための適応的でデータ駆動型のアプローチを提供します。
私たちのアルゴリズムのもう 1 つの明確な利点は、半教師あり学習フレームワークにあり、追加のラベルなしデータを完全に使用できるようになります。
この機能により、アルゴリズムがデータ多様体のスペクトルと曲率を調査できるようになり、データセットをより包括的に理解できるようになり、パフォーマンスが向上します。
さらに、私たちのアルゴリズムは完全にデータ駆動型で実行され、事前定義された多様体情報を必要とせず、データの固有の多様体構造内で直接動作します。
アルゴリズムの収束分析を提供します。
私たちの発見は、アルゴリズムが基礎となる多様体の固有次元のみに依存する収束率を達成し、それによってより高い周囲次元に関連する次元の呪いを回避することを明らかにしました。

要約(オリジナル)

We introduce a novel diffusion-based spectral algorithm to tackle regression analysis on high-dimensional data, particularly data embedded within lower-dimensional manifolds. Traditional spectral algorithms often fall short in such contexts, primarily due to the reliance on predetermined kernel functions, which inadequately address the complex structures inherent in manifold-based data. By employing graph Laplacian approximation, our method uses the local estimation property of heat kernel, offering an adaptive, data-driven approach to overcome this obstacle. Another distinct advantage of our algorithm lies in its semi-supervised learning framework, enabling it to fully use the additional unlabeled data. This ability enhances the performance by allowing the algorithm to dig the spectrum and curvature of the data manifold, providing a more comprehensive understanding of the dataset. Moreover, our algorithm performs in an entirely data-driven manner, operating directly within the intrinsic manifold structure of the data, without requiring any predefined manifold information. We provide a convergence analysis of our algorithm. Our findings reveal that the algorithm achieves a convergence rate that depends solely on the intrinsic dimension of the underlying manifold, thereby avoiding the curse of dimensionality associated with the higher ambient dimension.

arxiv情報

著者 Weichun Xia,Jiaxin Jiang,Lei Shi
発行日 2024-10-18 15:29:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク