Few-Shot Multi-Label Aspect Category Detection Utilizing Prototypical Network with Sentence-Level Weighting and Label Augmentation

要約

マルチラベル アスペクト カテゴリ検出は、特定の文内で発生する複数のアスペクト カテゴリを検出することを目的としています。
アスペクト カテゴリの検出は、限られたデータセットとデータの疎性によって悩まされることが多いため、アテンション メカニズムを備えたプロトタイプ ネットワークが少数ショットのアスペクト カテゴリ検出に適用されています。
それにもかかわらず、これまでに使用されているプロトタイプ ネットワークのほとんどは、サポート セット内のすべてのインスタンスの平均値を取得してプロトタイプを計算します。
これは、マルチラベル アスペクト カテゴリ検出におけるインスタンス間の変動を無視しているようです。
また、いくつかの関連作品では、ラベルのテキスト情報を利用して注意メカニズムを強化しています。
ただし、ラベルのテキスト情報は多くの場合短く限定されており、カテゴリを識別できるほど具体的ではありません。
この論文では、まず、各サポート セット インスタンスの単語レベルでのノイズを軽減するために、拡張されたラベル情報とともにサポート セット アテンションを導入します。
さらに、加重平均によってプロトタイプを計算するために、サポート セット内の各インスタンスに異なる重みを与える文レベルのアテンション メカニズムを使用します。
最後に、計算されたプロトタイプはさらにクエリ インスタンスと組み合わせて使用​​され、クエリ アテンションを計算し、それによってクエリ セットからノイズを除去します。
Yelp データセットの実験結果は、私たちが提案した方法が有用であり、4 つの異なるシナリオですべてのベースラインを上回るパフォーマンスを示しています。

要約(オリジナル)

Multi-label aspect category detection is intended to detect multiple aspect categories occurring in a given sentence. Since aspect category detection often suffers from limited datasets and data sparsity, the prototypical network with attention mechanisms has been applied for few-shot aspect category detection. Nevertheless, most of the prototypical networks used so far calculate the prototypes by taking the mean value of all the instances in the support set. This seems to ignore the variations between instances in multi-label aspect category detection. Also, several related works utilize label text information to enhance the attention mechanism. However, the label text information is often short and limited, and not specific enough to discern categories. In this paper, we first introduce support set attention along with the augmented label information to mitigate the noise at word-level for each support set instance. Moreover, we use a sentence-level attention mechanism that gives different weights to each instance in the support set in order to compute prototypes by weighted averaging. Finally, the calculated prototypes are further used in conjunction with query instances to compute query attention and thereby eliminate noises from the query set. Experimental results on the Yelp dataset show that our proposed method is useful and outperforms all baselines in four different scenarios.

arxiv情報

著者 Zeyu Wang,Mizuho Iwaihara
発行日 2023-09-27 11:44:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク