Revisiting Initializing Then Refining: An Incomplete and Missing Graph Imputation Network

要約

ソーシャル ネットワークやナレッジ グラフなどのさまざまなアプリケーションの開発に伴い、グラフ データは現実の世界に遍在するようになりました。
残念ながら、データ収集中のプライバシー保護ポリシーまたは著作権制限のために、通常、グラフが存在しないという問題があります。
グラフデータの不在は、属性が不完全な状況と属性が欠落している状況に大別できます。
具体的には、attribute-incomplete はすべてのノードの属性ベクトルの一部が不完全であることを示し、attribute-missing は部分ノードの属性ベクトル全体が欠落していることを示します。
多くの努力が注がれてきましたが、両方のタイプのグラフ データが同時に存在しないという一般的な状況に合わせてカスタム設計されたものはありません。
このギャップを埋めるために、Revisiting Initializing Then Refining (RITR) と呼ばれる新しいネットワークを開発します。ここでは、新しい初期化してから調整する代入基準のガイダンスの下で、属性が不完全なサンプルと属性が欠落しているサンプルの両方を完成させます。
具体的には、属性が不完全なサンプルを完成させるために、まずネットワーク学習の前にガウス ノイズを使用して不完全な属性を初期化し、次に構造と属性の相関行列を高次の構造行列に近似することによって不完全な値を調整するために構造と属性の一貫性制約を導入します。
.
属性欠落サンプルを完成させるために、最初に属性欠落サンプルの構造埋め込みを埋め込み初期化として採用し、動的親和性構造に従って属性不完全サンプルの信頼できる情報を適応的に集約することにより、これらの初期値を調整します。
私たちの知る限りでは、この新しく設計された方法は、ハイブリッド不在グラフの処理専用の最初の教師なしフレームワークです。
4 つのデータセットに対する広範な実験により、当社の方法が既存の最先端の競合他社よりも一貫して優れていることが確認されました。

要約(オリジナル)

With the development of various applications, such as social networks and knowledge graphs, graph data has been ubiquitous in the real world. Unfortunately, graphs usually suffer from being absent due to privacy-protecting policies or copyright restrictions during data collection. The absence of graph data can be roughly categorized into attribute-incomplete and attribute-missing circumstances. Specifically, attribute-incomplete indicates that a part of the attribute vectors of all nodes are incomplete, while attribute-missing indicates that the whole attribute vectors of partial nodes are missing. Although many efforts have been devoted, none of them is custom-designed for a common situation where both types of graph data absence exist simultaneously. To fill this gap, we develop a novel network termed Revisiting Initializing Then Refining (RITR), where we complete both attribute-incomplete and attribute-missing samples under the guidance of a novel initializing-then-refining imputation criterion. Specifically, to complete attribute-incomplete samples, we first initialize the incomplete attributes using Gaussian noise before network learning, and then introduce a structure-attribute consistency constraint to refine incomplete values by approximating a structure-attribute correlation matrix to a high-order structural matrix. To complete attribute-missing samples, we first adopt structure embeddings of attribute-missing samples as the embedding initialization, and then refine these initial values by adaptively aggregating the reliable information of attribute-incomplete samples according to a dynamic affinity structure. To the best of our knowledge, this newly designed method is the first unsupervised framework dedicated to handling hybrid-absent graphs. Extensive experiments on four datasets have verified that our methods consistently outperform existing state-of-the-art competitors.

arxiv情報

著者 Wenxuan Tu,Bin Xiao,Xinwang Liu,Sihang Zhou,Zhiping Cai,Jieren Cheng
発行日 2023-02-15 08:38:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク