Utilizing Local Hierarchy with Adversarial Training for Hierarchical Text Classification

要約

階層テキスト分類 (HTC) は、その複雑な分類構造により、マルチラベル分類の困難なサブタスクです。
最近の HTC のほぼすべての作品は、ラベルがどのように構造化されているかに焦点を当てていますが、有益なラベルの共起情報を含む各入力テキストに応じたグラウンドトゥルース ラベルの下部構造は無視されています。
この研究では、敵対的なフレームワークを使用してこのローカル階層を導入します。
私たちは、ほぼすべての HTC モデルに適合し、補助情報としてローカル階層を使用してモデルを最適化できる HiAdv フレームワークを提案します。
2 つの典型的な HTC モデルでテストしたところ、HiAdv があらゆるシナリオで効果的であり、複雑な分類階層の処理に優れていることがわかりました。
さらなる実験により、私たちのフレームワークの推進は確かにローカル階層から来ており、ローカル階層はトレーニングデータが不十分なまれなクラスにとって有益であることが示されています。

要約(オリジナル)

Hierarchical text classification (HTC) is a challenging subtask of multi-label classification due to its complex taxonomic structure. Nearly all recent HTC works focus on how the labels are structured but ignore the sub-structure of ground-truth labels according to each input text which contains fruitful label co-occurrence information. In this work, we introduce this local hierarchy with an adversarial framework. We propose a HiAdv framework that can fit in nearly all HTC models and optimize them with the local hierarchy as auxiliary information. We test on two typical HTC models and find that HiAdv is effective in all scenarios and is adept at dealing with complex taxonomic hierarchies. Further experiments demonstrate that the promotion of our framework indeed comes from the local hierarchy and the local hierarchy is beneficial for rare classes which have insufficient training data.

arxiv情報

著者 Zihan Wang,Peiyi Wang,Houfeng Wang
発行日 2024-03-29 08:08:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク