BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction

要約

アスペクト センチメント クワッド予測 (ASQP) は、アスペクト ターム、意見ターム、アスペクト カテゴリ、センチメント極性を含む 4 つのアスペクト ベースの要素を予測することを目的としています。
実際には、明確なデータ分布により、目に見えない側面がトレーニング済みニューラル モデルに多くの課題を課します。
これを動機として、この研究では ASQP を少数ショット シナリオに定式化し、実際のアプリケーションでの迅速な適応を目指しています。
したがって、最初に、より豊富なカテゴリを含み、少数ショット研究にとってよりバランスの取れた少数ショット ASQP データセット (FSQP) を構築します。
さらに、最近の方法では、入力文をテンプレート化されたターゲット シーケンスに変換する生成パラダイムを通じてクワッドを抽出します。
ただし、これらは主に 1 つのテンプレートの使用またはさまざまなテンプレートの順序の考慮に焦点を当てているため、さまざまなテンプレート間の相関関係が見落とされています。
この問題に取り組むために、異なるテンプレート間の相関関係を考慮して、より広い視野で複数のテンプレートを集約するブロードビュー ソフト プロンプティング (BvSP) 手法をさらに提案します。
具体的には、BvSP は事前トレーニングされた言語モデルを使用して、ジェンセンとシャノンの相違に最も関連性の高い k 個のテンプレートを選択します。
BvSP ではさらに、選択したテンプレートを使用して事前トレーニングされた言語モデルをガイドするためのソフト プロンプトが導入されています。
次に、投票メカニズムによって複数のテンプレートの結果を集計します。
経験的な結果は、BvSP が 4 つの少数ショット設定および他の公開データセットの下で最先端の手法よりも大幅に優れていることを示しています。
コードとデータセットは https://github.com/byinhao/BvSP で入手できます。

要約(オリジナル)

Aspect sentiment quad prediction (ASQP) aims to predict four aspect-based elements, including aspect term, opinion term, aspect category, and sentiment polarity. In practice, unseen aspects, due to distinct data distribution, impose many challenges for a trained neural model. Motivated by this, this work formulates ASQP into the few-shot scenario, which aims for fast adaptation in real applications. Therefore, we first construct a few-shot ASQP dataset (FSQP) that contains richer categories and is more balanced for the few-shot study. Moreover, recent methods extract quads through a generation paradigm, which involves converting the input sentence into a templated target sequence. However, they primarily focus on the utilization of a single template or the consideration of different template orders, thereby overlooking the correlations among various templates. To tackle this issue, we further propose a Broadview Soft Prompting (BvSP) method that aggregates multiple templates with a broader view by taking into account the correlation between the different templates. Specifically, BvSP uses the pre-trained language model to select the most relevant k templates with Jensen-Shannon divergence. BvSP further introduces soft prompts to guide the pre-trained language model using the selected templates. Then, we aggregate the results of multi-templates by voting mechanism. Empirical results demonstrate that BvSP significantly outperforms the stateof-the-art methods under four few-shot settings and other public datasets. Our code and dataset are available at https://github.com/byinhao/BvSP.

arxiv情報

著者 Yinhao Bai,Yalan Xie,Xiaoyi Liu,Yuhua Zhao,Zhixin Han,Mengting Hu,Hang Gao,Renhong Cheng
発行日 2024-06-11 15:32:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク