要約
この研究では、現在の最先端 (SOTA) テキスト埋め込みモデルを使用して、データレス インテント分類に説明拡張埋め込みの類似性を活用するためのいくつかのスキームを導入します。
私たちは、一般的に使用される 4 つの意図分類データセットに関する手法の結果を報告し、同様の性質の以前の研究と比較します。
私たちの研究では、多数の目に見えない意図に対応するデータレス分類の有望な結果が示されています。
すべてラベル付けされたデータまたはタスク固有のデータでのトレーニングを行わずに、強力なゼロショット ベースラインと比較して、競合する結果と大幅な改善 (+6.12\% 平均) を示しています。
さらに、この分野での今後の研究の指針となるように、この方法論の欠点に関する定性的エラー分析を提供します。
要約(オリジナル)
In this work, we introduce several schemes to leverage description-augmented embedding similarity for dataless intent classification using current state-of-the-art (SOTA) text embedding models. We report results of our methods on four commonly used intent classification datasets and compare against previous works of a similar nature. Our work shows promising results for dataless classification scaling to a large number of unseen intents. We show competitive results and significant improvements (+6.12\% Avg.) over strong zero-shot baselines, all without training on labelled or task-specific data. Furthermore, we provide qualitative error analysis of the shortfalls of this methodology to help guide future research in this area.
arxiv情報
著者 | Ruoyu Hu,Foaad Khosmood,Abbas Edalat |
発行日 | 2024-07-25 08:31:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google