Learning DAGs and Root Causes from Time-Series Data

要約

根本原因がほとんどない時系列から有向非巡回グラフ (DAG) を学習するための新しい方法である DAG-TFRC を紹介します。
これは、構造ベクトル自己回帰モデルに基づいて、特定の未知のノードおよび時点での少数のイベントによってデータが生成されることを意味します。
このようなデータについては、(i) ノード間の瞬間的な依存関係と時間差のある依存関係の両方を表す DAG を学習し、(ii) 根本原因の場所と時間を発見します。
根本原因がほとんどない合成データの場合、DAG-TFRC は以前の作業よりも精度と実行時間の点で優れたパフォーマンスを示し、最大数千ノードまで拡張できます。
シミュレートされた現実世界の金融データを用いた実験により、根本原因の希薄な仮定が実行可能であることが実証されました。
S&P 500 データに関して、DAG-TFRC はセクターごとに銘柄をクラスター化し、根本原因としての主要な株価変動を発見することに成功しました。

要約(オリジナル)

We introduce DAG-TFRC, a novel method for learning directed acyclic graphs (DAGs) from time series with few root causes. By this, we mean that the data are generated by a small number of events at certain, unknown nodes and time points under a structural vector autoregression model. For such data, we (i) learn the DAGs representing both the instantaneous and time-lagged dependencies between nodes, and (ii) discover the location and time of the root causes. For synthetic data with few root causes, DAG-TFRC shows superior performance in accuracy and runtime over prior work, scaling up to thousands of nodes. Experiments on simulated and real-world financial data demonstrate the viability of our sparse root cause assumption. On S&P 500 data, DAG-TFRC successfully clusters stocks by sectors and discovers major stock movements as root causes.

arxiv情報

著者 Panagiotis Misiakos,Markus Püschel
発行日 2025-01-06 16:48:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク