Open World Classification with Adaptive Negative Samples

要約

オープン ワールドの分類は、重要な実用的な関連性と影響を伴う自然言語処理のタスクです。
オープンまたは {\em unknown} カテゴリのデータは推論段階でのみ現れるため、既知のクラスの識別とオープン カテゴリの識別に対応する適切な決定境界を持つモデルを見つけることは困難です。
既存のモデルのパフォーマンスは、トレーニング段階での有効なオープン カテゴリ データの欠如、または適切な決定境界を学習するための適切なメカニズムの欠如によって制限されます。
事前知識や外部データセットを必要とせずに、トレーニング段階で効果的な合成オープン カテゴリ サンプルを生成するように設計された \underline{a}daptive \underline{n}egative \underline{s}amples (ANS) に基づくアプローチを提案します。
経験的に、生成された負のサンプルを効果的に利用し、以前の研究での複雑なしきい値探索段階を回避する、補助的な 1 対残りのバイナリ分類器を使用することに大きな利点があることがわかりました。
3 つのベンチマーク データセットでの広範な実験により、ANS が最先端の方法よりも大幅に改善されていることが示されています。

要約(オリジナル)

Open world classification is a task in natural language processing with key practical relevance and impact. Since the open or {\em unknown} category data only manifests in the inference phase, finding a model with a suitable decision boundary accommodating for the identification of known classes and discrimination of the open category is challenging. The performance of existing models is limited by the lack of effective open category data during the training stage or the lack of a good mechanism to learn appropriate decision boundaries. We propose an approach based on \underline{a}daptive \underline{n}egative \underline{s}amples (ANS) designed to generate effective synthetic open category samples in the training stage and without requiring any prior knowledge or external datasets. Empirically, we find a significant advantage in using auxiliary one-versus-rest binary classifiers, which effectively utilize the generated negative samples and avoid the complex threshold-seeking stage in previous works. Extensive experiments on three benchmark datasets show that ANS achieves significant improvements over state-of-the-art methods.

arxiv情報

著者 Ke Bai,Guoyin Wang,Jiwei Li,Sunghyun Park,Sungjin Lee,Puyang Xu,Ricardo Henao,Lawrence Carin
発行日 2023-03-09 21:12:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク