Cardinality Estimation over Knowledge Graphs with Embeddings and Graph Neural Networks

要約

ナレッジ グラフ (KG) のカーディナリティ推定は、クエリの最適化に不可欠ですが、典​​型的なナレッジ グラフの半構造化された性質と複雑な相関関係のために、依然として困難なタスクです。
この作業では、GNCE を提案します。これは、ナレッジ グラフの埋め込みとグラフ ニューラル ネットワーク (GNN) を活用して、結合クエリのカーディナリティを正確に予測する新しいアプローチです。
GNCE はまず、KG 内のすべてのエンティティに対して意味的に意味のある埋め込みを作成します。これは、指定されたクエリに統合され、GNN によって処理されてクエリのカーディナリティが推定されます。
q-Error に関して数 KG で GNCE を評価し、推定精度の点でサンプリング、要約、および (機械) 学習に基づく最先端のアプローチよりも優れていることを実証し、実行時間とパラメーターも少なくします。
.
さらに、GNCE が目に見えないエンティティに帰納的に一般化できるため、動的クエリ処理シナリオでの使用に適していることを示します。
私たちが提案するアプローチは、クエリの最適化と、結合クエリの正確なカーディナリティ推定に依存する関連アプリケーションを大幅に改善する可能性があります。

要約(オリジナル)

Cardinality Estimation over Knowledge Graphs (KG) is crucial for query optimization, yet remains a challenging task due to the semi-structured nature and complex correlations of typical Knowledge Graphs. In this work, we propose GNCE, a novel approach that leverages knowledge graph embeddings and Graph Neural Networks (GNN) to accurately predict the cardinality of conjunctive queries. GNCE first creates semantically meaningful embeddings for all entities in the KG, which are then integrated into the given query, which is processed by a GNN to estimate the cardinality of the query. We evaluate GNCE on several KGs in terms of q-Error and demonstrate that it outperforms state-of-the-art approaches based on sampling, summaries, and (machine) learning in terms of estimation accuracy while also having lower execution time and less parameters. Additionally, we show that GNCE can inductively generalise to unseen entities, making it suitable for use in dynamic query processing scenarios. Our proposed approach has the potential to significantly improve query optimization and related applications that rely on accurate cardinality estimates of conjunctive queries.

arxiv情報

著者 Tim Schwabe,Maribel Acosta
発行日 2023-03-02 10:39:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB, cs.LG パーマリンク