Label Dependencies-aware Set Prediction Networks for Multi-label Text Classification

要約

タイトル: Label Dependencies-aware Set Prediction Networks for Multi-label Text Classification
要約:
– 複数のラベルを1つの文章から抽出するマルチラベルテキスト分類の問題に焦点を当てた研究
– 学習用データセット内のラベルは順序がないため、直接的な集合予測問題として扱うことを提案
– ラベル間の相関をモデル化するために、ラベル間の統計的関係に基づいて隣接行列を構築し、GCNを使用してラベル情報を学習する
– 学習したラベル情報に基づいて、セット予測ネットワークが文章情報とラベル情報の両方を同時に利用してマルチラベルテキスト分類を行うことができる
– さらに、セット予測ネットワークの出力確率分布にBhattacharyya距離を課すことで、再現率能力を向上させる
– 4つのマルチラベルデータセットでの実験結果は、提案手法の有効性を示し、従来手法よりも大幅に優れている。

要約(オリジナル)

Multi-label text classification aims to extract all the related labels from a sentence, which can be viewed as a sequence generation problem. However, the labels in training dataset are unordered. We propose to treat it as a direct set prediction problem and don’t need to consider the order of labels. Besides, in order to model the correlation between labels, the adjacency matrix is constructed through the statistical relations between labels and GCN is employed to learn the label information. Based on the learned label information, the set prediction networks can both utilize the sentence information and label information for multi-label text classification simultaneously. Furthermore, the Bhattacharyya distance is imposed on the output probability distributions of the set prediction networks to increase the recall ability. Experimental results on four multi-label datasets show the effectiveness of the proposed method and it outperforms previous method a substantial margin.

arxiv情報

著者 Han Quanjie,Du Xinkai,Sun Yalin,Lv Chao
発行日 2023-04-14 09:31:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク