JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction

要約

製品属性値の抽出は、電子商取引における重要なタスクであり、製品の検索や推奨など、いくつかの下流アプリケーションに役立ちます。
以前のモデルのほとんどは、製品テキスト内の値の連続した位置情報に依存するシーケンス ラベリングまたは質問応答方式を使用してこのタスクを処理し、トレーニングとテストの間のデータの不一致に対して脆弱でした。
これにより、各製品がテキストやスタイルの構成が異なるさまざまなショッピング プラットフォームにわたって複数の説明を持つことができる現実世界のシナリオに対する一般化機能が制限されます。
また、新しい値に対するゼロショット能力も限られています。
本稿では、テキスト内の値の位置情報を必要とせずに値を予測する、JPAVEと呼ばれる値の生成/分類と属性予測を備えたマルチタスク学習モデルを提案します。
さらに、値ジェネレーターのコピーメカニズムと値分類器の値アテンションモジュールは、入力テキストの関連部分のみに焦点を当て、テキスト内の文構造などの不一致問題を引き起こす他の情報を無視することで、モデルがデータの不一致問題に対処するのに役立ちます。

さらに、モデルの 2 つのバリアントは、オープンワールドとクローズドワールドのシナリオ向けに設計されています。
さらに、値生成に基づいて最初のバリアントで導入されたコピー メカニズムにより、目に見えない値を識別するゼロショット機能を向上させることができます。
公開データセットでの実験結果は、強力なベースラインと比較したこのモデルの優位性と、新しい値を予測する一般化能力を示しています。

要約(オリジナル)

Product attribute value extraction is an important task in e-Commerce which can help several downstream applications such as product search and recommendation. Most previous models handle this task using sequence labeling or question answering method which rely on the sequential position information of values in the product text and are vulnerable to data discrepancy between training and testing. This limits their generalization ability to real-world scenario in which each product can have multiple descriptions across various shopping platforms with different composition of text and style. They also have limited zero-shot ability to new values. In this paper, we propose a multi-task learning model with value generation/classification and attribute prediction called JPAVE to predict values without the necessity of position information of values in the text. Furthermore, the copy mechanism in value generator and the value attention module in value classifier help our model address the data discrepancy issue by only focusing on the relevant part of input text and ignoring other information which causes the discrepancy issue such as sentence structure in the text. Besides, two variants of our model are designed for open-world and closed-world scenarios. In addition, copy mechanism introduced in the first variant based on value generation can improve its zero-shot ability for identifying unseen values. Experimental results on a public dataset demonstrate the superiority of our model compared with strong baselines and its generalization ability of predicting new values.

arxiv情報

著者 Zhongfen Deng,Hao Peng,Tao Zhang,Shuaiqi Liu,Wenting Zhao,Yibo Wang,Philip S. Yu
発行日 2023-11-07 18:36:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク