要約
従来のテキスト分類は通常、テキストを事前定義された粗いクラスに分類します。生成されたモデルは、正確なサービスのためにより細かいカテゴリが定期的に出現する現実世界のシナリオに対応できません。
この研究では、粗粒度のカテゴリの注釈と粗いものから細かいものへのマッピングのみを使用して、細かい粒度の分類が行われる設定を調査します。
我々は、パッセージのラベルを繰り返し改良するための軽量のコントラストクラスタリングベースのブートストラップ法を提案します。
クラスタリング中に、グローバルとローカルの両方の観点からのマッピングの指導の下で、ネガティブなパッセージとプロトタイプのペアが引き離されます。
NYT と 20News での実験では、私たちの方法が最先端の方法よりも大幅に優れていることが示されています。
要約(オリジナル)
Traditional text classification typically categorizes texts into pre-defined coarse-grained classes, from which the produced models cannot handle the real-world scenario where finer categories emerge periodically for accurate services. In this work, we investigate the setting where fine-grained classification is done only using the annotation of coarse-grained categories and the coarse-to-fine mapping. We propose a lightweight contrastive clustering-based bootstrapping method to iteratively refine the labels of passages. During clustering, it pulls away negative passage-prototype pairs under the guidance of the mapping from both global and local perspectives. Experiments on NYT and 20News show that our method outperforms the state-of-the-art methods by a large margin.
arxiv情報
著者 | Shudi Hou,Yu Xia,Muhao Chen,Sujian Li |
発行日 | 2023-06-07 15:49:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google