Construction and Applications of Billion-Scale Pre-trained Multimodal Business Knowledge Graph

要約

ビジネス ナレッジ グラフ (KG) は、今日の多くの企業にとって重要であり、事実に基づく知識と構造化データを提供して、多くの製品を操縦し、よりインテリジェントにします。
それらの有望な利点にもかかわらず、ビジネス KG を構築するには、不十分な構造と複数のモダリティの法外な問題を解決する必要があります。
このホワイト ペーパーでは、重要な現実世界のシステムで KG を構築することに関連する実際的な課題の理解を進めます。
有名企業アリババグループから派生したオープンビジネスナレッジグラフ(OpenBG)を構築するプロセスを紹介します。
具体的には、さまざまな抽象的な製品と消費需要をカバーするコア オントロジーを定義し、デプロイされたアプリケーションできめ細かな分類法とマルチモーダル ファクトを使用します。
OpenBG は、前例のない規模のオープン ビジネス KG です。100 万を超えるコア クラス/概念と 2,681 種類の関係をカバーする 8,800 万を超えるエンティティを含む 26 億のトリプル。
そこから派生したすべてのオープン リソース (OpenBG ベンチマーク) をコミュニティに公開し、KG 中心のタスクの実験結果を報告します。
また、OpenBG ベンチマークに基づくオンライン コンテストを開催し、数千のチームを引き付けました。
OpenBG をさらに事前トレーニングし、それをビジネス シナリオで KG によって強化された多くのダウンストリーム タスクに適用し、電子商取引における数十億規模のマルチモーダル知識の有効性を実証します。
コード付きのすべてのリソースは、\url{https://github.com/OpenBGBenchmark/OpenBG} で公開されています。

要約(オリジナル)

Business Knowledge Graphs (KGs) are important to many enterprises today, providing factual knowledge and structured data that steer many products and make them more intelligent. Despite their promising benefits, building business KG necessitates solving prohibitive issues of deficient structure and multiple modalities. In this paper, we advance the understanding of the practical challenges related to building KG in non-trivial real-world systems. We introduce the process of building an open business knowledge graph (OpenBG) derived from a well-known enterprise, Alibaba Group. Specifically, we define a core ontology to cover various abstract products and consumption demands, with fine-grained taxonomy and multimodal facts in deployed applications. OpenBG is an open business KG of unprecedented scale: 2.6 billion triples with more than 88 million entities covering over 1 million core classes/concepts and 2,681 types of relations. We release all the open resources (OpenBG benchmarks) derived from it for the community and report experimental results of KG-centric tasks. We also run up an online competition based on OpenBG benchmarks, and has attracted thousands of teams. We further pre-train OpenBG and apply it to many KG- enhanced downstream tasks in business scenarios, demonstrating the effectiveness of billion-scale multimodal knowledge for e-commerce. All the resources with codes have been released at \url{https://github.com/OpenBGBenchmark/OpenBG}.

arxiv情報

著者 Shumin Deng,Chengming Wang,Zhoubo Li,Ningyu Zhang,Zelin Dai,Hehong Chen,Feiyu Xiong,Ming Yan,Qiang Chen,Mosha Chen,Jiaoyan Chen,Jeff Z. Pan,Bryan Hooi,Huajun Chen
発行日 2023-02-15 04:14:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG パーマリンク