Zero-Shot Multi-Label Topic Inference with Sentence Encoders

要約

タイトル:文章エンコーダを用いたZero-Shot Multi-Label Topic Inference

要約:

– 文章エンコーダは多くのdownstream text-miningのタスクにおいて優れた性能を示しており、一般的であると主張されている。
– Zero-Shot topic inferenceのタスクにおいてこれらの文章エンコーダをどのように活用できるかについての詳細な研究を行った。
– ユーザがリアルタイムにトピックを定義したり提供したりするタスクに対して、Sentence-BERTは他のエンコーダに比べて優れた汎用性を示し、効率が最優先事項である場合はUniversal Sentence Encoderが好まれることを、7つの異なるデータセットでの広範な実験により示した。

要約(オリジナル)

Sentence encoders have indeed been shown to achieve superior performances for many downstream text-mining tasks and, thus, claimed to be fairly general. Inspired by this, we performed a detailed study on how to leverage these sentence encoders for the ‘zero-shot topic inference’ task, where the topics are defined/provided by the users in real-time. Extensive experiments on seven different datasets demonstrate that Sentence-BERT demonstrates superior generality compared to other encoders, while Universal Sentence Encoder can be preferred when efficiency is a top priority.

arxiv情報

著者 Souvika Sarkar,Dongji Feng,Shubhra Kanti Karmaker Santu
発行日 2023-04-14 20:27:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.IR パーマリンク