Knowledge-Enhanced Multi-Label Few-Shot Product Attribute-Value Extraction

要約

既存の属性値抽出 (AVE) モデルでは、トレーニングのために大量のラベル付きデータが必要です。
しかし、現実の電子商取引では、新しい属性と値のペアを持つ新製品が毎日市場に投入されます。
したがって、少数のトレーニング例に基づいて、まだ見たことのない属性値ペアを抽出することを目的として、マルチラベル少数ショット学習 (FSL) で AVE を定式化します。
私たちは、生成されたラベルの説明とカテゴリ情報を活用して、より識別力のあるプロトタイプを学習する、プロトタイプ ネットワークに基づく知識強化型注意フレームワーク (KEAF) を提案します。
さらに、KEAF はハイブリッド アテンションと統合して、ラベル関連およびクエリ関連の重みを計算することで、ノイズを削減し、各クラスのより有益なセマンティクスを取得します。
マルチラベル推論を実現するために、KEAF はサポート セットとクエリ セットの両方からのセマンティック情報を統合することにより、動的なしきい値をさらに学習します。
2 つのデータセットに対して行われたアブレーション研究による広範な実験により、FSL での情報抽出に関して KEAF が他の SOTA モデルよりも優れていることが実証されました。
コードは次の場所にあります: https://github.com/gjiaying/KEAF

要約(オリジナル)

Existing attribute-value extraction (AVE) models require large quantities of labeled data for training. However, new products with new attribute-value pairs enter the market every day in real-world e-Commerce. Thus, we formulate AVE in multi-label few-shot learning (FSL), aiming to extract unseen attribute value pairs based on a small number of training examples. We propose a Knowledge-Enhanced Attentive Framework (KEAF) based on prototypical networks, leveraging the generated label description and category information to learn more discriminative prototypes. Besides, KEAF integrates with hybrid attention to reduce noise and capture more informative semantics for each class by calculating the label-relevant and query-related weights. To achieve multi-label inference, KEAF further learns a dynamic threshold by integrating the semantic information from both the support set and the query set. Extensive experiments with ablation studies conducted on two datasets demonstrate that KEAF outperforms other SOTA models for information extraction in FSL. The code can be found at: https://github.com/gjiaying/KEAF

arxiv情報

著者 Jiaying Gong,Wei-Te Chen,Hoda Eldardiry
発行日 2023-08-16 14:58:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク