Informed Decision-Making through Advancements in Open Set Recognition and Unknown Sample Detection

要約

機械学習ベースの技術は、企業が情報に基づいた意思決定を行うのに役立つ、データからより深く実用的な洞察を引き出すための多くの機会と改善をもたらします。
ただし、これらの手法の大部分は、トレーニング セットとテスト セットのラベル空間が同一である従来の閉セット シナリオに焦点を当てています。
オープンセット認識 (OSR) は、より現実に近い状況で分類タスクを実現することを目的としており、未知のクラスを効果的に処理するだけでなく、既知のクラスを分類することに重点を置いています。
このような開集合問題では、トレーニング セット内で収集されたサンプルがすべてのクラスを包含することができないため、システムはテスト時に未知のサンプルを識別する必要があります。
一方で、実際の動的環境で正確かつ包括的なモデルを構築するには、多くの障害が伴います。未知の項目の考えられるすべての例をトレーニングするには法外にコストがかかり、テストベッドでテストするとモデルが失敗する可能性があるためです。
この研究は、OSR タスクにおける分類を改善するために、特徴空間の新しい表現を探索するアルゴリズムを提供します。
OSR を統合すると、ビジネス プロセスと意思決定の有効性と効率が向上し、より正確で洞察力に富んだ結果の予測が可能になります。
3 つの確立されたデータセットで提案された方法のパフォーマンスを実証します。
結果は、提案されたモデルが精度と F1 スコアの点でベースライン手法よりも優れていることを示しています。

要約(オリジナル)

Machine learning-based techniques open up many opportunities and improvements to derive deeper and more practical insights from data that can help businesses make informed decisions. However, the majority of these techniques focus on the conventional closed-set scenario, in which the label spaces for the training and test sets are identical. Open set recognition (OSR) aims to bring classification tasks in a situation that is more like reality, which focuses on classifying the known classes as well as handling unknown classes effectively. In such an open-set problem the gathered samples in the training set cannot encompass all the classes and the system needs to identify unknown samples at test time. On the other hand, building an accurate and comprehensive model in a real dynamic environment presents a number of obstacles, because it is prohibitively expensive to train for every possible example of unknown items, and the model may fail when tested in testbeds. This study provides an algorithm exploring a new representation of feature space to improve classification in OSR tasks. The efficacy and efficiency of business processes and decision-making can be improved by integrating OSR, which offers more precise and insightful predictions of outcomes. We demonstrate the performance of the proposed method on three established datasets. The results indicate that the proposed model outperforms the baseline methods in accuracy and F1-score.

arxiv情報

著者 Atefeh Mahdavi,Marco Carvalho
発行日 2024-05-09 15:15:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク