要約
ソーシャル ネットワークで友達を提案する際の大きな問題は、ソーシャル グラフのサイズが大きく、数億人のユーザーと数百億の接続が存在することです。
ヒューリスティックまたは因数分解に基づく古典的な手法は、より複雑なモデルをスケーリングする際の困難に対処するためによく使用されます。
ただし、これらの方法は教師なしであるため、最適とは言えない結果が生じる可能性があります。
この研究では、一般化された自我ネットワーク友情スコア フレームワークを導入します。これにより、スケーラビリティを犠牲にすることなく複雑な教師ありモデルを使用できるようになります。
このフレームワークの主な原理は、完全なグラフ上のリンク予測の問題を、その後の結果の集約を伴うエゴネット上の一連の低スケールのタスクに削減することです。
ここで、基礎となるモデルはエゴネットを入力として受け取り、そのノードのペアごとの関連性行列を生成します。
さらに、ソーシャル ネットワーク ドメインで効果的に機能する WalkGNN モデルを開発します。ソーシャル ネットワーク ドメインでは、グラフ レベルのリンク予測タスクが異種混合、動的で、特徴がありません。
このモデルの精度を測定するために、私たちが取り組んでいる現実世界の問題の正確な表現として機能する Ego-VK データセットを導入します。
データセットのオフライン実験では、当社のモデルがすべてのベースライン手法よりも優れていることが示され、ライブ A/B テストでは、当社のアプローチを利用した結果としてビジネス指標の成長が実証されました。
要約(オリジナル)
A major problem of making friend suggestions in social networks is the large size of social graphs, which can have hundreds of millions of people and tens of billions of connections. Classic methods based on heuristics or factorizations are often used to address the difficulties of scaling more complex models. However, the unsupervised nature of these methods can lead to suboptimal results. In this work, we introduce the Generalized Ego-network Friendship Score framework, which makes it possible to use complex supervised models without sacrificing scalability. The main principle of the framework is to reduce the problem of link prediction on a full graph to a series of low-scale tasks on ego-nets with subsequent aggregation of their results. Here, the underlying model takes an ego-net as input and produces a pairwise relevance matrix for its nodes. In addition, we develop the WalkGNN model which is capable of working effectively in the social network domain, where these graph-level link prediction tasks are heterogeneous, dynamic and featureless. To measure the accuracy of this model, we introduce the Ego-VK dataset that serves as an exact representation of the real-world problem that we are addressing. Offline experiments on the dataset show that our model outperforms all baseline methods, and a live A/B test demonstrates the growth of business metrics as a result of utilizing our approach.
arxiv情報
著者 | Evgeny Zamyatin |
発行日 | 2024-12-16 15:37:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google