Directed Acyclic Graph Structure Learning from Dynamic Graphs

要約

特徴量 (変数) の有向非巡回グラフ (DAG) の構造を推定することは、潜在的なデータ生成プロセスを明らかにし、さまざまなアプリケーションで因果関係の洞察を提供する上で重要な役割を果たします。
さまざまなタイプのデータを使用した構造学習については多くの研究が行われていますが、動的グラフ上の構造学習はまだ検討されていないため、このようなユビキタスな動的グラフデータに対するノード特徴生成メカニズムの学習問題を研究します。
動的グラフでは、ノード特徴間の同時関係と時間差のある相互作用関係を同時に推定することを提案します。
これら 2 種類の関係によって DAG が形成され、特徴生成プロセスを簡潔な方法で効果的に特徴付けることができます。
このような DAG を学習するために、学習問題を連続スコアベースの最適化問題としてキャストします。これは、学習された DAG の有効性を測定する微分可能なスコア関数と、学習された DAG の非周期性を保証する滑らかな非周期性制約で構成されます。
これら 2 つのコンポーネントは、成熟した連続最適化手法によって最小化できる、制約のない拡張ラグランジュ目標に変換されます。
結果として得られた GraphNOTEARS という名前のアルゴリズムは、現実世界のアプリケーションで遭遇する可能性のある幅広い設定にわたって、シミュレートされたデータのベースラインを上回るパフォーマンスを示します。
また、提案されたアプローチを現実世界の Yelp データセットから構築された 2 つの動的グラフに適用し、私たちの方法がドメインの知識に準拠したノード特徴間の接続を学習できることを実証しました。

要約(オリジナル)

Estimating the structure of directed acyclic graphs (DAGs) of features (variables) plays a vital role in revealing the latent data generation process and providing causal insights in various applications. Although there have been many studies on structure learning with various types of data, the structure learning on the dynamic graph has not been explored yet, and thus we study the learning problem of node feature generation mechanism on such ubiquitous dynamic graph data. In a dynamic graph, we propose to simultaneously estimate contemporaneous relationships and time-lagged interaction relationships between the node features. These two kinds of relationships form a DAG, which could effectively characterize the feature generation process in a concise way. To learn such a DAG, we cast the learning problem as a continuous score-based optimization problem, which consists of a differentiable score function to measure the validity of the learned DAGs and a smooth acyclicity constraint to ensure the acyclicity of the learned DAGs. These two components are translated into an unconstraint augmented Lagrangian objective which could be minimized by mature continuous optimization techniques. The resulting algorithm, named GraphNOTEARS, outperforms baselines on simulated data across a wide range of settings that may encounter in real-world applications. We also apply the proposed approach on two dynamic graphs constructed from the real-world Yelp dataset, demonstrating our method could learn the connections between node features, which conforms with the domain knowledge.

arxiv情報

著者 Shaohua Fan,Shuyang Zhang,Xiao Wang,Chuan Shi
発行日 2024-03-05 14:57:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク