要約
グラフモデルに基づくクラスタリング方法は、さまざまな知識ドメインにわたる広範な適用性に対する注意の高まりを示しています。
他の関連アプリケーションとシームレスに統合するための適応性は、データセット内で「自然関連」または「グラフ構造」を堅牢に抽出する機能を備えたグラフモデルベースのクラスタリング分析を延期し、データポイント間の関係のモデリングを促進します。
その有効性にもかかわらず、グラフベースのモデルを利用する現在のクラスタリング方法は、ノード間のランダムウォークアクセスとデータに組み込まれた構造情報に関連する不確実性を見落とします。
このギャップに対処するために、CMDIという名前のグラフベースモデル内で情報をデコードするための新しいクラスタリング方法を提示します。
CMDIは、グラフ構造抽出とグラフ頂点分割の2つのフェーズで構成されるクラスタリングプロセスに2次元構造情報理論を革新的に組み込みます。
CMDI内では、グラフパーティション化は抽象的なクラスタリングの問題として再定式化され、最大デコード情報を活用して、頂点へのランダムな訪問に関連する不確実性を最小限に抑えます。
3つの実際のデータセットの経験的評価は、CMDIが優れたデコード情報比(DI-R)を示す古典的なベースラインメソッドを上回ることを示しています。
さらに、CMDIは、特に事前知識(PK)を検討する場合、効率の向上を示しています。
これらの調査結果は、情報の品質と計算効率のデコードの強化におけるCMDIの有効性を強調し、グラフベースのクラスタリング分析の貴重なツールとして配置します。
要約(オリジナル)
The clustering method based on graph models has garnered increased attention for its widespread applicability across various knowledge domains. Its adaptability to integrate seamlessly with other relevant applications endows the graph model-based clustering analysis with the ability to robustly extract ‘natural associations’ or ‘graph structures’ within datasets, facilitating the modelling of relationships between data points. Despite its efficacy, the current clustering method utilizing the graph-based model overlooks the uncertainty associated with random walk access between nodes and the embedded structural information in the data. To address this gap, we present a novel Clustering method for Maximizing Decoding Information within graph-based models, named CMDI. CMDI innovatively incorporates two-dimensional structural information theory into the clustering process, consisting of two phases: graph structure extraction and graph vertex partitioning. Within CMDI, graph partitioning is reformulated as an abstract clustering problem, leveraging maximum decoding information to minimize uncertainty associated with random visits to vertices. Empirical evaluations on three real-world datasets demonstrate that CMDI outperforms classical baseline methods, exhibiting a superior decoding information ratio (DI-R). Furthermore, CMDI showcases heightened efficiency, particularly when considering prior knowledge (PK). These findings underscore the effectiveness of CMDI in enhancing decoding information quality and computational efficiency, positioning it as a valuable tool in graph-based clustering analyses.
arxiv情報
著者 | Xinrun Xu,Manying Lv,Zhanbiao Lian,Yurong Wu,Jin Yan,Shan Jiang,Zhiming Ding |
発行日 | 2025-04-01 08:10:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google