Label-Aware Automatic Verbalizer for Few-Shot Text Classification

要約

プロンプトベースの学習は、少数ショットのテキスト分類において有効であることが示されています。
成功の重要な要素の 1 つは、言語モデルからの出力を予測クラスに変換するバーバライザーです。
特に、最も単純で広く認知されている言語化ツールは、クラスを表すために手動のラベルを使用します。
ただし、手動選択では、選択した言語モデルを条件とした場合に、選択した単語の最適性が保証されません。
したがって、手動ラベルを効果的に強化して、少数ショットでより良い分類結果を達成する、ラベル認識自動言語化装置 (LAAV) を提案します。
具体的には、手動ラベルと接続詞「および」を使用して、言語化者にとってより効果的な単語を生成するようにモデルを誘導します。
5 つの言語にわたる 5 つのデータセットに関する実験結果は、LAAV が既存の言語化ツールよりも大幅に優れていることを示しています。
さらに、私たちの分析では、特に中程度から低程度のリソース言語において、LAAV は同様のアプローチと比較して、より関連性の高い単語を提案することが明らかになりました。

要約(オリジナル)

Prompt-based learning has shown its effectiveness in few-shot text classification. One important factor in its success is a verbalizer, which translates output from a language model into a predicted class. Notably, the simplest and widely acknowledged verbalizer employs manual labels to represent the classes. However, manual selection does not guarantee the optimality of the selected words when conditioned on the chosen language model. Therefore, we propose Label-Aware Automatic Verbalizer (LAAV), effectively augmenting the manual labels to achieve better few-shot classification results. Specifically, we use the manual labels along with the conjunction ‘and’ to induce the model to generate more effective words for the verbalizer. The experimental results on five datasets across five languages demonstrate that LAAV significantly outperforms existing verbalizers. Furthermore, our analysis reveals that LAAV suggests more relevant words compared to similar approaches, especially in mid-to-low resource languages.

arxiv情報

著者 Thanakorn Thaminkaew,Piyawat Lertvittayakumjorn,Peerapon Vateekul
発行日 2023-10-19 14:30:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク