Hierarchical Knowledge Graph Construction from Images for Scalable E-Commerce

要約

ナレッジ グラフ (KG) は、さまざまな AI システムにおいてますます重要な役割を果たしています。
電子商取引の場合、効率的かつ低コストで自動化されたナレッジ グラフ構築方法が、さまざまなダウンストリーム アプリケーションを成功させるための基盤となります。
この論文では、生の製品画像から構造化された製品知識グラフを構築するための新しい方法を提案します。
この方法では、ビジョン言語モデル (VLM) とラージ言語モデル (LLM) における最近の進歩を連携して活用し、プロセスを完全に自動化し、タイムリーなグラフ更新を可能にします。
また、ナレッジ グラフ構築における製品プロパティ抽出のベンチマーク用に、人間が注釈を付けた電子商取引製品データセットも紹介します。
私たちの方法は、すべての指標と評価された特性においてベースラインを上回っており、その有効性と明るい使用の可能性を示しています。

要約(オリジナル)

Knowledge Graph (KG) is playing an increasingly important role in various AI systems. For e-commerce, an efficient and low-cost automated knowledge graph construction method is the foundation of enabling various successful downstream applications. In this paper, we propose a novel method for constructing structured product knowledge graphs from raw product images. The method cooperatively leverages recent advances in the vision-language model (VLM) and large language model (LLM), fully automating the process and allowing timely graph updates. We also present a human-annotated e-commerce product dataset for benchmarking product property extraction in knowledge graph construction. Our method outperforms our baseline in all metrics and evaluated properties, demonstrating its effectiveness and bright usage potential.

arxiv情報

著者 Zhantao Yang,Han Zhang,Fangyi Chen,Anudeepsekhar Bolimera,Marios Savvides
発行日 2024-10-28 17:34:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク