要約
サポート ベクター マシン (SVM) による分類は、ターゲット クラスからのラベル付きデータのみに依存する場合、パフォーマンスが制限されることが多く、ノイズや外れ値の影響を受けやすくなります。
Universum データからの事前の知識とより堅牢なデータ表現を組み込むことで、精度と効率を向上させることができます。
これらの発見に動機付けられて、我々は、モデルのトレーニング中に Universum サンプルとグラニュラー ボール コンピューティングの両方を活用するように TSVM フレームワークを拡張する、Universum データを使用した新しいグラニュラー ボール ツイン サポート ベクター マシン (GBU-TSVM) を提案します。
既存の TSVM 手法とは異なり、提案された GBU-TSVM はデータ インスタンスを特徴空間内の点ではなくハイパー ボールとして表します。
この革新的なアプローチにより、特にノイズの多い大規模なデータセットの処理において、モデルの堅牢性と効率が向上します。
データ ポイントを粒状のボールにグループ化することにより、モデルは優れた計算効率、ノイズ耐性の向上、および解釈可能性の向上を実現します。
さらに、厳密にはターゲット クラスからのものではないサンプルで構成される Universum データを含めることで、分類の境界がさらに洗練されます。
この統合により、コンテキスト情報でモデルが強化され、分類境界が洗練され、全体的な精度が向上します。
UCI ベンチマーク データセットの実験結果は、GBU-TSVM が精度と計算効率の両方で既存の TSVM モデルよりも優れていることを示しています。
これらの発見は、データ表現と分類における新しい標準を設定する際の GBU-TSVM モデルの可能性を強調しています。
要約(オリジナル)
Classification with support vector machines (SVM) often suffers from limited performance when relying solely on labeled data from target classes and is sensitive to noise and outliers. Incorporating prior knowledge from Universum data and more robust data representations can enhance accuracy and efficiency. Motivated by these findings, we propose a novel Granular Ball Twin Support Vector Machine with Universum Data (GBU-TSVM) that extends the TSVM framework to leverage both Universum samples and granular ball computing during model training. Unlike existing TSVM methods, the proposed GBU-TSVM represents data instances as hyper-balls rather than points in the feature space. This innovative approach improves the model’s robustness and efficiency, particularly in handling noisy and large datasets. By grouping data points into granular balls, the model achieves superior computational efficiency, increased noise resistance, and enhanced interpretability. Additionally, the inclusion of Universum data, which consists of samples that are not strictly from the target classes, further refines the classification boundaries. This integration enriches the model with contextual information, refining classification boundaries and boosting overall accuracy. Experimental results on UCI benchmark datasets demonstrate that the GBU-TSVM outperforms existing TSVM models in both accuracy and computational efficiency. These findings highlight the potential of the GBU-TSVM model in setting a new standard in data representation and classification.
arxiv情報
著者 | M. A. Ganaie,Vrushank Ahire |
発行日 | 2024-12-04 15:02:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google