ComOM at VLSP 2023: A Dual-Stage Framework with BERTology and Unified Multi-Task Instruction Tuning Model for Vietnamese Comparative Opinion Mining

要約

ComOM の共有タスクは、ベトナム語での製品レビューから比較意見を抽出することを目的としています。
(1) 比較文識別 (CSI) と (2) 比較要素抽出 (CEE) の 2 つのサブタスクがあります。
最初のタスクは、入力が比較レビューであるかどうかを識別することであり、2 番目のタスクの目的は、比較レビューで言及された 5 つ子を抽出することです。
このタスクに対処するために、私たちのチームは、CSI タスク用の BERTology モデルの微調整と CEE タスク用の統合マルチタスク命令チューニングに基づく 2 段階システムを提案します。
さらに、単純なデータ拡張手法を適用して、第 2 段階でモデルをトレーニングするためのデータセットのサイズを増やします。
実験結果は、当社のアプローチが他の競合他社を上回り、公式プライベートテストでトップスコアを達成したことを示しています。

要約(オリジナル)

The ComOM shared task aims to extract comparative opinions from product reviews in Vietnamese language. There are two sub-tasks, including (1) Comparative Sentence Identification (CSI) and (2) Comparative Element Extraction (CEE). The first task is to identify whether the input is a comparative review, and the purpose of the second task is to extract the quintuplets mentioned in the comparative review. To address this task, our team proposes a two-stage system based on fine-tuning a BERTology model for the CSI task and unified multi-task instruction tuning for the CEE task. Besides, we apply the simple data augmentation technique to increase the size of the dataset for training our model in the second stage. Experimental results show that our approach outperforms the other competitors and has achieved the top score on the official private test.

arxiv情報

著者 Dang Van Thin,Duong Ngoc Hao,Ngan Luu-Thuy Nguyen
発行日 2023-12-14 14:44:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク