Clustering of Incomplete Data via a Bipartite Graph Structure

要約

データクラスタリングのグラフ学習には、さまざまなグラフ構造を介してさまざまなスペクトルと構造の制約を組み込んだグラフ学習にはさまざまなアプローチがあります。
いくつかの方法は、ノードがセンターとメンバーの2つのクラスに分割される二部グラフモデルに依存しています。
これらのモデルは通常、メンバーノードからの観測に加えて、センターノードのデータへのアクセスを必要とします。
ただし、多くの実際のシナリオでは、このような追加データが常に利用できるとは限りません。
さらに、グラフ学習用の一般的なガウスモデルは、金融市場で一般的な重尾分布を使用したデータのモデリングにおける有効性が限られていることを実証しています。
この論文では、これらの課題に対処する二部グラフモデルに基づいてクラスタリング方法を提案します。
まず、センターノードに関する情報を必要とせずに、不完全なデータからクラスターを推測できます。
第二に、重い尾のデータを効果的に処理するように設計されています。
実際の財務データを使用した数値実験は、データクラスタリングの提案方法の効率を検証します。

要約(オリジナル)

There are various approaches to graph learning for data clustering, incorporating different spectral and structural constraints through diverse graph structures. Some methods rely on bipartite graph models, where nodes are divided into two classes: centers and members. These models typically require access to data for the center nodes in addition to observations from the member nodes. However, such additional data may not always be available in many practical scenarios. Moreover, popular Gaussian models for graph learning have demonstrated limited effectiveness in modeling data with heavy-tailed distributions, which are common in financial markets. In this paper, we propose a clustering method based on a bipartite graph model that addresses these challenges. First, it can infer clusters from incomplete data without requiring information about the center nodes. Second, it is designed to effectively handle heavy-tailed data. Numerical experiments using real financial data validate the efficiency of the proposed method for data clustering.

arxiv情報

著者 Amirhossein Javaheri,Daniel P. Palomar
発行日 2025-05-13 14:06:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク