When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes

要約

特に意味的に類似したクラスが多数あるシナリオに対して、高速かつ正確な少数ショット分類を提供する FastFit、メソッド、および Python パッケージ設計を紹介します。
FastFit は、バッチ対照学習とトークンレベルの類似性スコアを統合した新しいアプローチを利用します。
SetFit、Transformers、または API 呼び出しによる大規模言語モデルの数ショット プロンプトなどの既存の数ショット学習パッケージと比較して、FastFit は、FewMany、新しく厳選された英語ベンチマーク、および多言語データセット全体での速度と精度におけるマルチクラス分類パフォーマンスを大幅に向上させます。

FastFit はトレーニング速度が 3 ~ 20 倍向上し、わずか数秒でトレーニングを完了できます。
FastFit パッケージは GitHub と PyPi で利用できるようになり、NLP 実践者にとって使いやすいソリューションを提供します。

要約(オリジナル)

We present FastFit, a method, and a Python package design to provide fast and accurate few-shot classification, especially for scenarios with many semantically similar classes. FastFit utilizes a novel approach integrating batch contrastive learning and token-level similarity score. Compared to existing few-shot learning packages, such as SetFit, Transformers, or few-shot prompting of large language models via API calls, FastFit significantly improves multiclass classification performance in speed and accuracy across FewMany, our newly curated English benchmark, and Multilingual datasets. FastFit demonstrates a 3-20x improvement in training speed, completing training in just a few seconds. The FastFit package is now available on GitHub and PyPi, presenting a user-friendly solution for NLP practitioners.

arxiv情報

著者 Asaf Yehudai,Elron Bendel
発行日 2024-04-18 17:48:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG パーマリンク