要約
エクストリーム マルチラベル テキスト分類は、ラベル階層を利用してエクストリーム ラベルを複数のラベル グループに分割し、タスクを単純なマルチグループ マルチラベル分類タスクに変えます。
現在の研究では、ラベルを固定長のベクトルとしてエンコードするため、異なるラベル グループに対して複数の分類子を確立する必要があります。
問題は、階層内のラベルの関係を犠牲にすることなく、分類器を 1 つだけ構築する方法です。
この論文では、極端なマルチラベル分類にマルチアンサー質問タスクを採用しています。
この論文では、補助的な分類評価メトリックも提案します。
本研究では、提案手法と評価指標を法的な領域に適用する。
合法ベルトの活用とタスク分散の研究について論じた。
実験結果は、提案された階層と複数回答の質問タスクが、EURLEX データセットの極端な複数ラベル分類を実行できることを示しています。
また、マルチラベル分類タスクのマイナー/微調整では、ドメインに適応したBERTモデルは、この実験で明らかな利点を示すことができませんでした.
この方法は、ゼロショット学習にも理論的に適用できます。
要約(オリジナル)
Extreme multi-label text classification utilizes the label hierarchy to partition extreme labels into multiple label groups, turning the task into simple multi-group multi-label classification tasks. Current research encodes labels as a vector with fixed length which needs establish multiple classifiers for different label groups. The problem is how to build only one classifier without sacrificing the label relationship in the hierarchy. This paper adopts the multi-answer questioning task for extreme multi-label classification. This paper also proposes an auxiliary classification evaluation metric. This study adopts the proposed method and the evaluation metric to the legal domain. The utilization of legal Berts and the study on task distribution are discussed. The experiment results show that the proposed hierarchy and multi-answer questioning task can do extreme multi-label classification for EURLEX dataset. And in minor/fine-tuning the multi-label classification task, the domain adapted BERT models could not show apparent advantages in this experiment. The method is also theoretically applicable to zero-shot learning.
arxiv情報
| 著者 | Li Wang,Ying Wah Teh,Mohammed Ali Al-Garadi |
| 発行日 | 2023-03-02 08:40:31+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google