要約
学習モデルの複雑さはグラフのサイズに応じて増加するため、大規模なグラフ機械学習は困難です。
グラフのサブサンプリングは実行可能な代替手段ですが、グラフは非ユークリッドであるため、グラフのサンプリングは自明ではありません。
既存のグラフ サンプリング手法では、大きな行列のスペクトルを計算するだけでなく、グラフが変化するとき、たとえば成長するときにこれらの計算を繰り返すことも必要です。
この論文では、グラフ リミットの一種であるグラフオンに対する信号サンプリング理論を紹介します。
我々は、グラフオン信号のポアンカレ不等式を証明し、この不等式を満たすノード サブセットの補集合が、グラフオン信号のペイリー ウィナー空間の一意のサンプリング セットであることを示します。
スペクトル クラスタリングとガウス消去法との関係を利用して、収束グラフ シーケンス上の固有のサンプリング セットがグラフン上の固有のサンプリング セットに収束するという意味で、そのようなサンプリング セットが一貫していることを証明します。
次に、大規模なグラフに関連するグラフオン信号サンプリング アルゴリズムを提案し、グラフ機械学習タスクでの優れた経験的パフォーマンスを実証します。
要約(オリジナル)
Large-scale graph machine learning is challenging as the complexity of learning models scales with the graph size. Subsampling the graph is a viable alternative, but sampling on graphs is nontrivial as graphs are non-Euclidean. Existing graph sampling techniques require not only computing the spectra of large matrices but also repeating these computations when the graph changes, e.g., grows. In this paper, we introduce a signal sampling theory for a type of graph limit — the graphon. We prove a Poincar\’e inequality for graphon signals and show that complements of node subsets satisfying this inequality are unique sampling sets for Paley-Wiener spaces of graphon signals. Exploiting connections with spectral clustering and Gaussian elimination, we prove that such sampling sets are consistent in the sense that unique sampling sets on a convergent graph sequence converge to unique sampling sets on the graphon. We then propose a related graphon signal sampling algorithm for large graphs, and demonstrate its good empirical performance on graph machine learning tasks.
arxiv情報
著者 | Thien Le,Luana Ruiz,Stefanie Jegelka |
発行日 | 2023-11-17 16:04:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google