要約
グラフオートエンコーダー(GAE)および変異グラフ自動エンコーダー(VGA)は、監視されていないノード埋め込み方法の2つの強力なグループとして出現し、リンク予測やコミュニティ検出などのグラフベースの機械学習問題にさまざまなアプリケーションを使用します。
それにもかかわらず、この博士号の初めに
プロジェクト、GAE、およびVGAEモデルも重要な制限に苦しんでおり、業界で採用されるのを防ぎました。
この論文では、グラフ表現を含む産業レベルの問題に対処するためにそれらの使用を促進するという一般的な目的で、これらのモデルを改善するためのいくつかの貢献を提示します。
まず、以前のGAEおよびVGAEモデルのスケーラビリティの問題を克服するための2つの戦略を提案し、これらのモデルを何百万ものノードとエッジを持つ大きなグラフで効果的に訓練することを許可します。
これらの戦略は、グラフの縮退と確率的サブグラフデコード技術をそれぞれ活用します。
また、重力にインスパイアされたGAEおよびVGAEを導入し、産業用途で遍在する、指示されたグラフのこれらのモデルの最初の拡張を提供します。
また、動的グラフのGAEおよびVGAEモデルの拡張を検討します。
さらに、GAEおよびVGAEモデルはしばしば不必要に複雑であることが多いと主張し、線形エンコーダーを活用することでそれらを簡素化することを提案します。
最後に、グラフのコミュニティの検出を改善しながら、リンクの予測に関する良いパフォーマンスを共同で保持するために、モジュラーリティアウェアGAEおよびVGAEを導入します。
この論文の最後の部分では、音楽ストリーミングサービスディーザーから抽出されたいくつかのグラフでの方法を評価します。
グラフベースの音楽の推奨の問題に重点を置いています。
特に、私たちの方法は、ユーザーに推奨する同様の音楽アイテムのコミュニティの検出を改善し、コールドスタートの設定で同様のアーティストを効果的にランク付けできること、および文化全体の音楽ジャンル認識のモデリングを許可することを示しています。
要約(オリジナル)
Graph autoencoders (GAE) and variational graph autoencoders (VGAE) emerged as two powerful groups of unsupervised node embedding methods, with various applications to graph-based machine learning problems such as link prediction and community detection. Nonetheless, at the beginning of this Ph.D. project, GAE and VGAE models were also suffering from key limitations, preventing them from being adopted in the industry. In this thesis, we present several contributions to improve these models, with the general aim of facilitating their use to address industrial-level problems involving graph representations. Firstly, we propose two strategies to overcome the scalability issues of previous GAE and VGAE models, permitting to effectively train these models on large graphs with millions of nodes and edges. These strategies leverage graph degeneracy and stochastic subgraph decoding techniques, respectively. Besides, we introduce Gravity-Inspired GAE and VGAE, providing the first extensions of these models for directed graphs, that are ubiquitous in industrial applications. We also consider extensions of GAE and VGAE models for dynamic graphs. Furthermore, we argue that GAE and VGAE models are often unnecessarily complex, and we propose to simplify them by leveraging linear encoders. Lastly, we introduce Modularity-Aware GAE and VGAE to improve community detection on graphs, while jointly preserving good performances on link prediction. In the last part of this thesis, we evaluate our methods on several graphs extracted from the music streaming service Deezer. We put the emphasis on graph-based music recommendation problems. In particular, we show that our methods can improve the detection of communities of similar musical items to recommend to users, that they can effectively rank similar artists in a cold start setting, and that they permit modeling the music genre perception across cultures.
arxiv情報
| 著者 | Guillaume Salha-Galvan | 
| 発行日 | 2025-06-18 14:49:00+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
