Balancing Summarization and Change Detection in Graph Streams

要約

この研究では、グラフの要約とグラフ変化の検出のバランスをとる問題に取り組んでいます。
グラフの要約は、大規模なグラフをより小さな規模に圧縮します。
ただし、元のグラフをどの程度まで圧縮する必要があるのか​​という疑問が残ります。
この問題は、一連の概要グラフを使用して統計的に重要な変化を検出することを目的として、グラフ変化検出の観点から解決されます。
圧縮率が非常に高い場合は、重要な変更が無視される可能性がありますが、圧縮率が非常に低い場合は、メモリが増えると誤ったアラームが増加する可能性があります。
これは、グラフ要約の圧縮率と変化検出の精度の間にトレードオフがあることを意味します。
我々は、このトレードオフのバランスをとり、信頼性の高いグラフの要約と変化の検出を同時に実現するための新しい定量的方法論を提案します。
階層型潜在変数モデルの確率的構造をグラフに導入し,最小記述長原則に基づいてパラメータ化された要約グラフを設計した。
次に、サマリー グラフを指定するパラメーターが最適化され、変化検出の精度が保証されて、タイプ I エラーの確率 (誤ったアラームが生成される確率) が所定の信頼レベル未満に抑えられます。
まず、グラフの要約と変化の検出を結び付けるための理論的フレームワークを提供します。
次に、合成データセットと実際のデータセットでその有効性を実証します。

要約(オリジナル)

This study addresses the issue of balancing graph summarization and graph change detection. Graph summarization compresses large-scale graphs into a smaller scale. However, the question remains: To what extent should the original graph be compressed? This problem is solved from the perspective of graph change detection, aiming to detect statistically significant changes using a stream of summary graphs. If the compression rate is extremely high, important changes can be ignored, whereas if the compression rate is extremely low, false alarms may increase with more memory. This implies that there is a trade-off between compression rate in graph summarization and accuracy in change detection. We propose a novel quantitative methodology to balance this trade-off to simultaneously realize reliable graph summarization and change detection. We introduce a probabilistic structure of hierarchical latent variable model into a graph, thereby designing a parameterized summary graph on the basis of the minimum description length principle. The parameter specifying the summary graph is then optimized so that the accuracy of change detection is guaranteed to suppress Type I error probability (probability of raising false alarms) to be less than a given confidence level. First, we provide a theoretical framework for connecting graph summarization with change detection. Then, we empirically demonstrate its effectiveness on synthetic and real datasets.

arxiv情報

著者 Shintaro Fukushima,Kenji Yamanishi
発行日 2023-12-12 14:48:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML パーマリンク