Improving Link Prediction in Social Networks Using Local and Global Features: A Clustering-based Approach

要約

リンク予測問題は、ソーシャル ネットワーク分析、バイオインフォマティクス実験、交通ネットワーク、犯罪捜査などの多くの分野でますます顕著になってきています。
リンク予測問題に対してはさまざまな手法が開発されており、次の 2 つに分類されます。1) 一連の特徴を研究して類似ノードを抽出する類似性に基づくアプローチ。
2) 入力データからパターンを抽出する学習ベースのアプローチ。
3) 形成確率を最適に計算できるモデルを確立するためにパラメータのセットを最適化する確率統計的アプローチ。
しかし、既存の文献には、それぞれのアプローチを統合することでそれぞれの強みを活用し、より生産的なものを達成するアプローチが欠けています。
リンク予測の問題に取り組むために、第 1 グループと第 2 グループの方法の組み合わせに基づくアプローチを提案します。
既存の研究作品は、これらのカテゴリの 1 つだけを使用しています。
私たちが開発した 2 段階の手法では、最初にノードの位置と動的挙動に関連する新しい特徴を決定します。これにより、単なる手段を使用するアプローチと比較して、より効率的なアプローチが実行されます。
次に、部分空間クラスタリング アルゴリズムが適用され、クラスターの強度を区別する計算された類似性尺度に基づいてソーシャル オブジェクトがグループ化されます。
基本的に、ローカルおよびグローバル インデックスとクラスタリング情報の使用は、リンク予測プロセスにおいて重要な役割を果たします。
Facebook、Brightkite、HepTh などの実際のデータセットで行われたいくつかの広範な実験は、私たちの提案方法の優れたパフォーマンスを示しています。
さらに、私たちのアプローチの優位性を証明するために、この分野でのいくつかの以前の技術を使用して私たちのアプローチを実験的に検証しました。

要約(オリジナル)

Link prediction problem has increasingly become prominent in many domains such as social network analyses, bioinformatics experiments, transportation networks, criminal investigations and so forth. A variety of techniques has been developed for link prediction problem, categorized into 1) similarity based approaches which study a set of features to extract similar nodes; 2) learning based approaches which extract patterns from the input data; 3) probabilistic statistical approaches which optimize a set of parameters to establish a model which can best compute formation probability. However, existing literatures lack approaches which utilize strength of each approach by integrating them to achieve a much more productive one. To tackle the link prediction problem, we propose an approach based on the combination of first and second group methods; the existing studied works use just one of these categories. Our two-phase developed method firstly determines new features related to the position and dynamic behavior of nodes, which enforce the approach more efficiency compared to approaches using mere measures. Then, a subspace clustering algorithm is applied to group social objects based on the computed similarity measures which differentiate the strength of clusters; basically, the usage of local and global indices and the clustering information plays an imperative role in our link prediction process. Some extensive experiments held on real datasets including Facebook, Brightkite and HepTh indicate good performances of our proposal method. Besides, we have experimentally verified our approach with some previous techniques in the area to prove the supremacy of ours.

arxiv情報

著者 Safiye Ghasemi,Amin Zarei
発行日 2023-05-17 14:45:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SI パーマリンク