要約
分類は、データ マイニングと機械学習の分野で最も研究されているタスクの 1 つであり、医学、生物学、セキュリティ、リモート センシングなどの複数の知識分野の分類問題を解決するために、文献の多くの研究が提示されています。
あらゆる種類のアプリケーションで最良の結果を達成する単一の分類器は存在しないため、優れた代替手段は分類器融合戦略を採用することです。
分類子融合アプローチの成功における重要なポイントは、アンサンブルに属する分類子間の多様性と精度の組み合わせです。
文献で利用可能な分類モデルが大量にあるため、課題の 1 つは、最終的な分類システムを構成するのに最も適した分類子を選択することであり、分類子の選択戦略が必要になります。
この点に対処するには、CIF-E (分類子、初期化、フィットネス関数、および進化的アルゴリズム) と呼ばれる 4 段階のプロトコルに基づく分類子の選択と融合のフレームワークを提案します。
提案された CIF-E プロトコルに従って、24 のさまざまなアンサンブル アプローチを実装および評価し、最も正確なアプローチを見つけることができます。
最良のアプローチと文献からの他の多くのベースラインの間で比較分析も行われました。
実験は、一変量周辺分布アルゴリズム (UMDA) に基づく提案された進化的アプローチが、多くのよく知られている UCI データセットにおける最先端の文献アプローチよりも優れていることを示しています。
要約(オリジナル)
Classification is one of the most studied tasks in data mining and machine learning areas and many works in the literature have been presented to solve classification problems for multiple fields of knowledge such as medicine, biology, security, and remote sensing. Since there is no single classifier that achieves the best results for all kinds of applications, a good alternative is to adopt classifier fusion strategies. A key point in the success of classifier fusion approaches is the combination of diversity and accuracy among classifiers belonging to an ensemble. With a large amount of classification models available in the literature, one challenge is the choice of the most suitable classifiers to compose the final classification system, which generates the need of classifier selection strategies. We address this point by proposing a framework for classifier selection and fusion based on a four-step protocol called CIF-E (Classifiers, Initialization, Fitness function, and Evolutionary algorithm). We implement and evaluate 24 varied ensemble approaches following the proposed CIF-E protocol and we are able to find the most accurate approach. A comparative analysis has also been performed among the best approaches and many other baselines from the literature. The experiments show that the proposed evolutionary approach based on Univariate Marginal Distribution Algorithm (UMDA) can outperform the state-of-the-art literature approaches in many well-known UCI datasets.
arxiv情報
著者 | Alvaro R. Ferreira Jr,Fabio A. Faria,Gustavo Carneiro,Vinicius V. de Melo |
発行日 | 2022-08-23 14:23:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google