Growing and Serving Large Open-domain Knowledge Graphs

要約

大規模なオープンドメインのナレッジ グラフ (KG) を現実世界の問題に適用すると、多くの特有の課題が生じます。
このペーパーでは、継続的な構築と大規模な知識の提供のためのプラットフォームの Saga への拡張機能を紹介します。
特に、ファクトランキング、ファクト検証、関連エンティティサービス、エンティティリンクのサポートなどの主要な機能を強化するナレッジグラフ埋め込みをトレーニングするためのパイプラインについて説明します。
次に、グラフの埋め込みを含むプラットフォームを活用して、非構造化 Web ドキュメントを KG 内のエンティティにリンクするセマンティック アノテーション サービスを作成する方法について説明します。
Web のセマンティック アノテーションは、エッジを備えたナレッジ グラフをオープン ドメインの Web コンテンツに効果的に拡張し、さまざまな検索やランキングの問題に使用できます。
最後に、注釈付きの Web ドキュメントを活用して、オープンドメインの知識の抽出を推進します。
この対象を絞った抽出フレームワークは、KG 内の重要なカバレッジの問題を特定し、Web 上のターゲット エンティティに関連するデータ ソースを見つけて、不足している情報を抽出して KG を強化します。
最後に、デバイス上でプライベートな個人知識を構築して提供するために必要なナレッジ プラットフォームへの適応について説明します。
これには、プライベートな増分 KG の構築、デバイス間のナレッジ同期、グローバルなナレッジの強化が含まれます。

要約(オリジナル)

Applications of large open-domain knowledge graphs (KGs) to real-world problems pose many unique challenges. In this paper, we present extensions to Saga our platform for continuous construction and serving of knowledge at scale. In particular, we describe a pipeline for training knowledge graph embeddings that powers key capabilities such as fact ranking, fact verification, a related entities service, and support for entity linking. We then describe how our platform, including graph embeddings, can be leveraged to create a Semantic Annotation service that links unstructured Web documents to entities in our KG. Semantic annotation of the Web effectively expands our knowledge graph with edges to open-domain Web content which can be used in various search and ranking problems. Finally, we leverage annotated Web documents to drive Open-domain Knowledge Extraction. This targeted extraction framework identifies important coverage issues in the KG, then finds relevant data sources for target entities on the Web and extracts missing information to enrich the KG. Finally, we describe adaptations to our knowledge platform needed to construct and serve private personal knowledge on-device. This includes private incremental KG construction, cross-device knowledge sync, and global knowledge enrichment.

arxiv情報

著者 Ihab F. Ilyas,JP Lacerda,Yunyao Li,Umar Farooq Minhas,Ali Mousavi,Jeffrey Pound,Theodoros Rekatsinas,Chiraag Sumanth
発行日 2023-05-16 14:23:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DB パーマリンク