要約
比較レビューは、消費者の好みを理解し、購入の意思決定に影響を与える上で極めて重要です。
比較五重抽出 (COQE) は、テキスト内の 5 つの主要な構成要素 (ターゲット エンティティ、比較されるエンティティ、比較される側面、これらの側面に関する意見、および極性) を識別することを目的としています。
製品レビューから正確な比較情報を抽出することは、従来の方法では微妙な言語や連続したタスクのエラーが原因で困難です。
これらの問題を軽減するために、COQE 用に設計されたエンドツーエンド モデルである MTP-COQE を提案します。
MTP-COQE は、複数の視点からのプロンプトベースの学習を活用して、比較意見マイニング タスクにおける生成モデルを効果的に導きます。
Camera-COQE (英語) および VCOM (ベトナム) データセットの評価では、COQE の自動化における MTP-COQE の有効性が実証され、英語のデータセットで以前のベースライン モデルよりも 1.41% 高い F1 スコアで優れたパフォーマンスを達成しました。
さらに、出力が期待に応えられるように、生成モデルの創造性を制限する戦略を設計しました。
また、データの不均衡に対処し、モデルが優勢なサンプルに偏ることを防ぐために、データの拡張も実行しました。
要約(オリジナル)
Comparative reviews are pivotal in understanding consumer preferences and influencing purchasing decisions. Comparative Quintuple Extraction (COQE) aims to identify five key components in text: the target entity, compared entities, compared aspects, opinions on these aspects, and polarity. Extracting precise comparative information from product reviews is challenging due to nuanced language and sequential task errors in traditional methods. To mitigate these problems, we propose MTP-COQE, an end-to-end model designed for COQE. Leveraging multi-perspective prompt-based learning, MTP-COQE effectively guides the generative model in comparative opinion mining tasks. Evaluation on the Camera-COQE (English) and VCOM (Vietnamese) datasets demonstrates MTP-COQE’s efficacy in automating COQE, achieving superior performance with a 1.41% higher F1 score than the previous baseline models on the English dataset. Additionally, we designed a strategy to limit the generative model’s creativity to ensure the output meets expectations. We also performed data augmentation to address data imbalance and to prevent the model from becoming biased towards dominant samples.
arxiv情報
| 著者 | Hai-Yen Thi Nguyen,Cam-Van Thi Nguyen |
| 発行日 | 2024-12-11 16:18:52+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google