Local Intrinsic Dimensionality Measures for Graphs, with Applications to Graph Embeddings

要約

ローカル固有次元 (LID) の概念は、データ マイニング、機械学習、類似性検索問題に応用できる、データ次元分析における重要な進歩です。
既存の距離ベースの LID 推定器は、ユークリッド空間内のベクトルとして表されるデータ ポイントを含む表形式のデータセット用に設計されています。
グラフの埋め込みとグラフの距離を考慮したグラフ構造データの限界について議論した後、ノードの自然コミュニティを固有の局所として最短経路距離の識別力を定量化するための新しいLID関連の尺度であるNC-LIDを提案します。

NC-LID 値に従って調整されるパーソナライズされたハイパーパラメータを使用して、node2vec の 2 つの LID 弾性バリアントを定式化することにより、この手段を使用して LID 対応グラフ埋め込みアルゴリズムを設計する方法が示されています。
多数の実世界のグラフに対する NC-LID の実証分析では、この尺度がノード中心性メトリクスよりも、node2vec 埋め込みでリンク再構築エラーが高いノードを示すことができることが示されています。
実験的評価では、提案された LID 弾性ノード 2vec 拡張機能が、生成された埋め込み内のグラフ構造をより良く保存することにより、ノード 2vec を改善することも示しています。

要約(オリジナル)

The notion of local intrinsic dimensionality (LID) is an important advancement in data dimensionality analysis, with applications in data mining, machine learning and similarity search problems. Existing distance-based LID estimators were designed for tabular datasets encompassing data points represented as vectors in a Euclidean space. After discussing their limitations for graph-structured data considering graph embeddings and graph distances, we propose NC-LID, a novel LID-related measure for quantifying the discriminatory power of the shortest-path distance with respect to natural communities of nodes as their intrinsic localities. It is shown how this measure can be used to design LID-aware graph embedding algorithms by formulating two LID-elastic variants of node2vec with personalized hyperparameters that are adjusted according to NC-LID values. Our empirical analysis of NC-LID on a large number of real-world graphs shows that this measure is able to point to nodes with high link reconstruction errors in node2vec embeddings better than node centrality metrics. The experimental evaluation also shows that the proposed LID-elastic node2vec extensions improve node2vec by better preserving graph structure in generated embeddings.

arxiv情報

著者 Miloš Savić,Vladimir Kurbalija,Miloš Radovanović
発行日 2023-07-13 12:40:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク