On support vector machines under a multiple-cost scenario

要約

サポート ベクター マシン (SVM) はバイナリ分類における強力なツールであり、優れた誤分類率を達成することが知られています。
一方、医療診断、チャーン、不正行為の予測など、現実世界の多くの分類問題には、クラスごとに異なる可能性がある誤分類コストが伴います。
ただし、ユーザーがそのような誤分類コストの正確な値を指定するのは難しい場合がありますが、許容可能な誤分類率の値を特定することははるかに簡単です。
この論文では、問題の定式化にパフォーマンスの制約を組み込むことで誤分類コストを考慮した新しい SVM モデルを提案します。
具体的には、私たちの目的は、指定されたしきい値を下回る誤分類率を生み出す最大のマージンを持つ超平面を探すことです。
このような最大マージン超平面は、線形制約と整数変数を使用して二次凸問題を解くことによって取得されます。
報告された数値経験は、私たちのモデルが、あるクラスの誤分類率をユーザーに制御させ(おそらく他のクラスの誤分類率の増加を犠牲にして)、実行時間の観点から実現可能であることを示しています。

要約(オリジナル)

Support Vector Machine (SVM) is a powerful tool in binary classification, known to attain excellent misclassification rates. On the other hand, many realworld classification problems, such as those found in medical diagnosis, churn or fraud prediction, involve misclassification costs which may be different in the different classes. However, it may be hard for the user to provide precise values for such misclassification costs, whereas it may be much easier to identify acceptable misclassification rates values. In this paper we propose a novel SVM model in which misclassification costs are considered by incorporating performance constraints in the problem formulation. Specifically, our aim is to seek the hyperplane with maximal margin yielding misclassification rates below given threshold values. Such maximal margin hyperplane is obtained by solving a quadratic convex problem with linear constraints and integer variables. The reported numerical experience shows that our model gives the user control on the misclassification rates in one class (possibly at the expense of an increase in misclassification rates for the other class) and is feasible in terms of running times.

arxiv情報

著者 Sandra Benítez-Peña,Rafael Blanquero,Emilio Carrizosa,Pepa Ramírez-Cobo
発行日 2023-12-22 16:12:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク