要約
非構造化コーパスから構造化知識を抽出するための、ユーザーフレンドリーでスケーラブルなナレッジグラフ構築 (KGC) システムを設計します。
既存の KGC システムとは異なり、gBuilder は、IE モデルの迅速な開発を受け入れる柔軟なユーザー定義のパイプラインを提供します。
さまざまなドメインからのデータに適応するために、さらに多くの組み込みのテンプレート ベースまたはヒューリスティック演算子とプログラム可能な演算子を使用できます。
さらに、大規模なナレッジ グラフ構築におけるスケーラビリティを確保するために、gBuilder 用のクラウドベースの自己適応型タスク スケジューリングも設計しています。
実験による評価では、統一プラットフォームでナレッジ グラフ構築のための複数の情報抽出モデルを組織する gBuilder の機能が実証され、大規模な KGC タスクに対するその高い拡張性が確認されました。
要約(オリジナル)
We design a user-friendly and scalable knowledge graph construction (KGC) system for extracting structured knowledge from the unstructured corpus. Different from existing KGC systems, gBuilder provides a flexible and user-defined pipeline to embrace the rapid development of IE models. More built-in template-based or heuristic operators and programmable operators are available for adapting to data from different domains. Furthermore, we also design a cloud-based self-adaptive task scheduling for gBuilder to ensure its scalability on large-scale knowledge graph construction. Experimental evaluation demonstrates the ability of gBuilder to organize multiple information extraction models for knowledge graph construction in a uniform platform, and confirms its high scalability on large-scale KGC tasks.
arxiv情報
| 著者 | Yanzeng Li,Lei Zou |
| 発行日 | 2023-12-11 14:33:00+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google