Learning To Rank Resources with GNN

要約

タイトル:GNNによるリソースのランキング学習

要約:
– インターネット上のコンテンツが拡大するにつれ、多様性に富むデータの新しいソースが常に現れている。
– 従来の検索エンジンではインターネットの拡大に沿って同じペースでクロールおよびインデックスできない。
– また、インターネット上のデータの大部分は従来の検索エンジンではアクセスできない。
– それに対して、分散情報検索(DIR)は複数のシャード(リソース)を統合し、統一的なアクセスを提供することによって解決策となる。
– リソースの選択はDIRシステムの重要な要素である。
– 既存のアプローチの主な制限は、単語ベースの統計的特徴を主に使用し、リソース-クエリおよびリソース-リソースの関係を一般的にモデリングしないことである。
– 本稿では、リソース-クエリおよびリソース-リソースの関係をモデリングできるGNNベースのランキング学習アプローチを提案する。
– 具体的には、事前学習された言語モデル(PTLM)からクエリとリソースの意味情報を取得し、異種グラフを明示的に構築し、GNNを使用して構造情報を抽出する。
– さらに、異種グラフはリソース-リソースタイプのエッジで強化され、ランキング精度がさらに高められる。
– ベンチマークデータセットでの広範な実験により、提案手法が高度に効果的であり、State-of-The-Art手法を各種パフォーマンスメトリックで6.4%〜42%上回ることが明らかになった。

要約(オリジナル)

As the content on the Internet continues to grow, many new dynamically changing and heterogeneous sources of data constantly emerge. A conventional search engine cannot crawl and index at the same pace as the expansion of the Internet. Moreover, a large portion of the data on the Internet is not accessible to traditional search engines. Distributed Information Retrieval (DIR) is a viable solution to this as it integrates multiple shards (resources) and provides a unified access to them. Resource selection is a key component of DIR systems. There is a rich body of literature on resource selection approaches for DIR. A key limitation of the existing approaches is that they primarily use term-based statistical features and do not generally model resource-query and resource-resource relationships. In this paper, we propose a graph neural network (GNN) based approach to learning-to-rank that is capable of modeling resource-query and resource-resource relationships. Specifically, we utilize a pre-trained language model (PTLM) to obtain semantic information from queries and resources. Then, we explicitly build a heterogeneous graph to preserve structural information of query-resource relationships and employ GNN to extract structural information. In addition, the heterogeneous graph is enriched with resource-resource type of edges to further enhance the ranking accuracy. Extensive experiments on benchmark datasets show that our proposed approach is highly effective in resource selection. Our method outperforms the state-of-the-art by 6.4% to 42% on various performance metrics.

arxiv情報

著者 Ulugbek Ergashev,Eduard C. Dragut,Weiyi Meng
発行日 2023-04-17 02:01:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.IR, cs.LG パーマリンク