Long-range Meta-path Search through Progressive Sampling on Large-scale Heterogeneous Information Networks

要約

長距離依存関係の利用は、同種グラフでは広く研究されていますが、大規模な異種情報ネットワーク (HIN) ではほとんど研究されていません。HIN の主な課題はコストが高く、効果的な情報を利用することが難しいことです。
この目的を達成するために、我々はさまざまなメタパスの重要性を調査し、プログレッシブ サンプリングによる長距離メタパス検索 (LMSPS) と呼ばれる、HIN の長距離依存関係を利用するための自動フレームワークを提案します。
具体的には、さまざまなデータセットまたはタスクのメタパスを事前に検出することなく、ターゲット ノードに関連するすべてのメタパスを含む検索スペースを開発します。
プログレッシブ サンプリング アルゴリズムを使用して、ホップに依存しない時間計算量で検索スペースを動的に縮小し、現在の HIN とタスクによって駆動されるコンパクトな検索スペースを実現します。
サンプリング評価戦略を指針として利用し、専門的かつ表現力豊かなメタパスの選択を実施します。
8 つの異種データセットに対する広範な実験により、LMSPS が効果的な長距離メタパスを発見し、最先端のモデルを上回るパフォーマンスを発揮することが実証されました。
さらに、Open Graph Benchmark の ogbn-mag のリーダーボードでもトップ 1 にランクされています。

要約(オリジナル)

Utilizing long-range dependency, though extensively studied in homogeneous graphs, is rarely studied in large-scale heterogeneous information networks (HINs), whose main challenge is the high costs and the difficulty in utilizing effective information. To this end, we investigate the importance of different meta-paths and propose an automatic framework for utilizing long-range dependency in HINs, called Long-range Meta-path Search through Progressive Sampling (LMSPS). Specifically, to discover meta-paths for various datasets or tasks without prior, we develop a search space with all target-node-related meta-paths. With a progressive sampling algorithm, we dynamically shrink the search space with hop-independent time complexity, leading to a compact search space driven by the current HIN and task. Utilizing a sampling evaluation strategy as the guidance, we conduct a specialized and expressive meta-path selection. Extensive experiments on eight heterogeneous datasets demonstrate that LMSPS discovers effective long-range meta-paths and outperforms state-of-the-art models. Besides, it ranks top-1 on the leaderboards of ogbn-mag in Open Graph Benchmark.

arxiv情報

著者 Chao Li,Zijie Guo,Qiuting He,Hao Xu,Kun He
発行日 2023-09-29 13:54:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク