Improving embedding of graphs with missing data by soft manifolds

要約

連続空間へのグラフの埋め込みは、さまざまなタスク (学習、推論、予測など) に適用される自動情報抽出アルゴリズムの設計および開発における重要な要素です。
グラフ埋め込みの信頼性は、連続空間のジオメトリがグラフ構造とどの程度一致するかに直接依存します。
多様体は、グラフの特性、特にノードの距離を位相空間に組み込むことを可能にする数学的構造です。
最先端の多様体ベースのグラフ埋め込みアルゴリズムは、多様体の各点 (グラフのノードに対応) の接線空間への投影が局所的にユークリッド空間に似ているという仮定を利用しています。
この条件は、埋め込み問題に対する効率的な分析ソリューションを達成するのに役立ちますが、レコードが欠落している疎なデータセットに対して計算されることが多いノード間の重み付けされた接続によって特徴付けられる、現代の現実のグラフを操作するための適切な設定を表していません。
この研究では、この状況を解決できるソフト多様体と呼ばれる新しいクラスの多様体を導入します。
特に、ソフト多様体は球面対称の数学的構造であり、各点への接空間はデータ点を横切る情報伝播の速度に従って形状が定義される内サイクロイドです。
グラフの埋め込みにソフト多様体を使用すると、複雑なデータセットに対するデータ分析のあらゆるタスクを追求するための連続空間を提供できます。
合成データセットと実際のデータセットでの再構成タスクに関する実験結果は、提案されたアプローチが最先端技術と比較して、連続空間におけるグラフのより正確かつ信頼性の高い特性評価をどのように可能にするかを示しています。

要約(オリジナル)

Embedding graphs in continous spaces is a key factor in designing and developing algorithms for automatic information extraction to be applied in diverse tasks (e.g., learning, inferring, predicting). The reliability of graph embeddings directly depends on how much the geometry of the continuous space matches the graph structure. Manifolds are mathematical structure that can enable to incorporate in their topological spaces the graph characteristics, and in particular nodes distances. State-of-the-art of manifold-based graph embedding algorithms take advantage of the assumption that the projection on a tangential space of each point in the manifold (corresponding to a node in the graph) would locally resemble a Euclidean space. Although this condition helps in achieving efficient analytical solutions to the embedding problem, it does not represent an adequate set-up to work with modern real life graphs, that are characterized by weighted connections across nodes often computed over sparse datasets with missing records. In this work, we introduce a new class of manifold, named soft manifold, that can solve this situation. In particular, soft manifolds are mathematical structures with spherical symmetry where the tangent spaces to each point are hypocycloids whose shape is defined according to the velocity of information propagation across the data points. Using soft manifolds for graph embedding, we can provide continuous spaces to pursue any task in data analysis over complex datasets. Experimental results on reconstruction tasks on synthetic and real datasets show how the proposed approach enable more accurate and reliable characterization of graphs in continuous spaces with respect to the state-of-the-art.

arxiv情報

著者 Andrea Marinoni,Pietro Lio’,Alessandro Barp,Christian Jutten,Mark Girolami
発行日 2023-11-29 12:48:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CG, cs.LG パーマリンク