Community Detection Using Revised Medoid-Shift Based on KNN

要約

タイトル:KNNに基づく改訂Medoid-Shiftを利用したコミュニティ検出

要約:

– コミュニティ検出は、ソーシャルネットワークの急速な普及に伴い、重要な問題になってきた。

– 優れたクラスタリングアルゴリズムであるMean-Shiftは、座標を持つデータにしか適用できないため、コミュニティ検出に直接適用することができない。

– 新しいクラスタリングアルゴリズムであるMedoid-Shiftが提案された。Medoid-ShiftはMean-Shiftの利点を保持しつつ、距離行列(または類似度行列)に基づく問題に適用することができる。

– Medoid-Shiftアルゴリズムの欠点の1つは、距離パラメータによって定義された近傍領域にデータ点が存在しない場合があることである。

– この問題に対処するため、この研究では改訂Medoid-Shift(RMS)アルゴリズムが提案された。RMSアルゴリズムはKNNによって定義された近傍に基づいて次のメドイドを見つけるプロセスに基づいており、これにより、よりスムーズに収束する可能性がある。

– RMSメソッドでは、各データポイントはKNNで定義された近傍内のメドイドに向けてシフトされる。シフトの繰り返し処理後、各データポイントはクラスターセンターに収束し、同じセンターに収束するデータポイントは同じクラスターにグループ化される。

要約(オリジナル)

Community detection becomes an important problem with the booming of social networks. As an excellent clustering algorithm, Mean-Shift can not be applied directly to community detection, since Mean-Shift can only handle data with coordinates, while the data in the community detection problem is mostly represented by a graph that can be treated as data with a distance matrix (or similarity matrix). Fortunately, a new clustering algorithm called Medoid-Shift is proposed. The Medoid-Shift algorithm preserves the benefits of Mean-Shift and can be applied to problems based on distance matrix, such as community detection. One drawback of the Medoid-Shift algorithm is that there may be no data points within the neighborhood region defined by a distance parameter. To deal with the community detection problem better, a new algorithm called Revised Medoid-Shift (RMS) in this work is thus proposed. During the process of finding the next medoid, the RMS algorithm is based on a neighborhood defined by KNN, while the original Medoid-Shift is based on a neighborhood defined by a distance parameter. Since the neighborhood defined by KNN is more stable than the one defined by the distance parameter in terms of the number of data points within the neighborhood, the RMS algorithm may converge more smoothly. In the RMS method, each of the data points is shifted towards a medoid within the neighborhood defined by KNN. After the iterative process of shifting, each of the data point converges into a cluster center, and the data points converging into the same center are grouped into the same cluster.

arxiv情報

著者 Jie Hou,Jiakang Li,Xiaokang Peng,Wei Ke,Yonggang Lu
発行日 2023-04-19 09:02:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.SI パーマリンク