SNOiC: Soft Labeling and Noisy Mixup based Open Intent Classification Model

要約

この論文では、ソフト ラベリングとノイズ混合ベースのオープン インテント分類モデル (SNOiC) について説明します。
これまでの研究のほとんどは、オープン インテントを識別するためにしきい値ベースの手法を使用していましたが、これはオーバーフィッティングの傾向があり、偏った予測を生成する可能性があります。
さらに、オープン インテント クラスにはより多くの利用可能なデータが必要であるため、これらの既存のモデルには別の制限が生じます。
SNOiC は、ソフト ラベリングとノイジー ミックスアップ戦略を組み合わせてバイアスを軽減し、オープン インテント クラスの疑似データを生成します。
4 つのベンチマーク データセットの実験結果は、SNOiC モデルがオープン インテントの識別において、それぞれ最小と最大のパフォーマンス 68.72\% と 94.71\% を達成していることを示しています。
さらに、最先端のモデルと比較して、SNOiC モデルはオープン インテントを識別するパフォーマンスを 0.93\% (最小) および 12.76\% (最大) 向上させます。
モデルの有効性は、提案されたモデルで使用されるさまざまなパラメーターを分析することによってさらに確立されます。
SNOiC モデルの有効性を検証するために 3 つのモデルのバリアントを作成するアブレーション研究も行われます。

要約(オリジナル)

This paper presents a Soft Labeling and Noisy Mixup-based open intent classification model (SNOiC). Most of the previous works have used threshold-based methods to identify open intents, which are prone to overfitting and may produce biased predictions. Additionally, the need for more available data for an open intent class presents another limitation for these existing models. SNOiC combines Soft Labeling and Noisy Mixup strategies to reduce the biasing and generate pseudo-data for open intent class. The experimental results on four benchmark datasets show that the SNOiC model achieves a minimum and maximum performance of 68.72\% and 94.71\%, respectively, in identifying open intents. Moreover, compared to state-of-the-art models, the SNOiC model improves the performance of identifying open intents by 0.93\% (minimum) and 12.76\% (maximum). The model’s efficacy is further established by analyzing various parameters used in the proposed model. An ablation study is also conducted, which involves creating three model variants to validate the effectiveness of the SNOiC model.

arxiv情報

著者 Aditi Kanwar,Aditi Seetha,Satyendra Singh Chouhan,Rajdeep Niyogi
発行日 2023-10-11 08:40:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG, F.2.2, I.2.7 パーマリンク