要約
重要なサイバー物理システムにおけるレアイベント検出に通常使用される、不均衡なマルチクラス データセットの課題に対処するために、最適で効率的かつ適応性のある混合整数計画法 (MIP) アンサンブル重み付けスキームを提案します。
私たちのアプローチは、分類子アンサンブルの多様な機能をクラスごとに細かく活用しながら、堅牢性と一般化を向上させるためにエラスティックネット正則化を使用して分類子とクラスのペアの重みを最適化します。
さらに、指定されたセットから事前定義された数の分類器をシームレスかつ最適に選択します。
さまざまなアンサンブル サイズの下で、代表的なデータセットと適切なメトリクスを使用して、MIP ベースの手法を 6 つの十分に確立された重み付けスキームに対して評価および比較します。
実験結果では、MIP が既存のすべてのアプローチよりも優れており、すべてのデータセットとアンサンブル サイズにわたる全体平均 4.53% で、0.99% から 7.31% の範囲のバランスのとれた精度の向上を達成していることが明らかになりました。
さらに、計算効率を維持しながら、マクロ平均精度、再現率、および F1 スコアがそれぞれ 4.63%、4.60%、および 4.61% という全体平均の向上を達成します。
要約(オリジナル)
To address the challenges of imbalanced multi-class datasets typically used for rare event detection in critical cyber-physical systems, we propose an optimal, efficient, and adaptable mixed integer programming (MIP) ensemble weighting scheme. Our approach leverages the diverse capabilities of the classifier ensemble on a granular per class basis, while optimizing the weights of classifier-class pairs using elastic net regularization for improved robustness and generalization. Additionally, it seamlessly and optimally selects a predefined number of classifiers from a given set. We evaluate and compare our MIP-based method against six well-established weighting schemes, using representative datasets and suitable metrics, under various ensemble sizes. The experimental results reveal that MIP outperforms all existing approaches, achieving an improvement in balanced accuracy ranging from 0.99% to 7.31%, with an overall average of 4.53% across all datasets and ensemble sizes. Furthermore, it attains an overall average increase of 4.63%, 4.60%, and 4.61% in macro-averaged precision, recall, and F1-score, respectively, while maintaining computational efficiency.
arxiv情報
著者 | Georgios Tertytchny,Georgios L. Stavrinides,Maria K. Michael |
発行日 | 2024-12-20 12:49:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google