Streaming Active Learning for Regression Problems Using Regression via Classification

要約

機械学習モデルを導入する際の課題の 1 つは、動作環境の変化に応じてモデルのパフォーマンスが低下することです。
パフォーマンスを維持するために、ストリーミング アクティブ ラーニングが使用されます。この学習では、サンプルの予測が十分に確実でない場合、トレーニング データセットに新しくアノテーションが付けられたサンプルを追加することでモデルが再トレーニングされます。
分類に関してはストリーミングアクティブラーニング手法が数多く提案されているが、産業分野で扱われることが多い回帰問題についてはほとんど取り組みがなされていない。
この論文では、回帰のストリーミングアクティブラーニングに分類経由回帰フレームワークを使用することを提案します。
分類経由回帰は、回帰問題を分類問題に変換するため、分類問題に対して提案されたストリーミング アクティブ ラーニング手法を回帰問題に直接適用できます。
4つの実際のデータセットに対する実験的検証により、提案された方法が同じアノテーションコストでより高い精度で回帰を実行できることが示されています。

要約(オリジナル)

One of the challenges in deploying a machine learning model is that the model’s performance degrades as the operating environment changes. To maintain the performance, streaming active learning is used, in which the model is retrained by adding a newly annotated sample to the training dataset if the prediction of the sample is not certain enough. Although many streaming active learning methods have been proposed for classification, few efforts have been made for regression problems, which are often handled in the industrial field. In this paper, we propose to use the regression-via-classification framework for streaming active learning for regression. Regression-via-classification transforms regression problems into classification problems so that streaming active learning methods proposed for classification problems can be applied directly to regression problems. Experimental validation on four real data sets shows that the proposed method can perform regression with higher accuracy at the same annotation cost.

arxiv情報

著者 Shota Horiguchi,Kota Dohi,Yohei Kawaguchi
発行日 2023-12-15 16:01:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク