DynED: Dynamic Ensemble Diversification in Data Stream Classification

要約

アンサンブル手法は、その優れたパフォーマンスにより分類によく使用されます。
データ ストリーム環境で高精度を達成することは、コンセプト ドリフトとも呼ばれるデータ分布の破壊的な変化を考慮すると、困難な課題です。
このような設定では、アンサンブル コンポーネントの多様性が高まることで予測精度が向上することが知られています。
アンサンブル内のコンポーネントは多様であるにもかかわらず、すべてがその全体的なパフォーマンスに期待どおりに寄与するわけではありません。
そのため、高性能で多様性のあるコンポーネントを選択する方法が必要になります。
アンサンブルの構築プロセス中にコンポーネントの多様性と予測精度を動的に組み合わせる MMR (Maximal Marginal Relevance) に基づいた新しいアンサンブルの構築と維持のアプローチを提案します。
4 つの実際のデータセットと 11 の合成データセットの両方に関する実験結果は、提案されたアプローチ (DynED) が 5 つの最先端のベースラインと比較して高い平均精度を提供することを示しています。

要約(オリジナル)

Ensemble methods are commonly used in classification due to their remarkable performance. Achieving high accuracy in a data stream environment is a challenging task considering disruptive changes in the data distribution, also known as concept drift. A greater diversity of ensemble components is known to enhance prediction accuracy in such settings. Despite the diversity of components within an ensemble, not all contribute as expected to its overall performance. This necessitates a method for selecting components that exhibit high performance and diversity. We present a novel ensemble construction and maintenance approach based on MMR (Maximal Marginal Relevance) that dynamically combines the diversity and prediction accuracy of components during the process of structuring an ensemble. The experimental results on both four real and 11 synthetic datasets demonstrate that the proposed approach (DynED) provides a higher average mean accuracy compared to the five state-of-the-art baselines.

arxiv情報

著者 Soheil Abadifard,Sepehr Bakhshi,Sanaz Gheibuni,Fazli Can
発行日 2023-08-21 15:56:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク