Online Boosting Adaptive Learning under Concept Drift for Multistream Classification

要約

マルチストリーム分類は、コンセプト ドリフトを伴う動的ストリーミング プロセスに迅速に適応する必要があるため、重大な課題を引き起こします。
この分野での研究成果が増えているにもかかわらず、これらのストリーム間の時間的な動的な関係に関して注目すべき見落としがあり、無関係なデータから生じる負の転送の問題につながっています。
この論文では、異なるストリーム間の動的相関を適応的に学習することで、この制限に効果的に対処する新しいオンライン ブースティング適応学習 (OBAL) 方法を提案します。
具体的には、OBAL はデュアルフェーズ メカニズムで動作します。最初のフェーズでは、さまざまなソース ストリームからのアーカイブ データを使用して初期化されたアンサンブル モデルを構築するための Adaptive COvariate Shift Adaptation (AdaCOSA) アルゴリズムを設計します。これにより、動的データを学習しながら共変量シフトを軽減します。
適応的な再重み付け戦略による相関。
オンラインプロセス中に、ガウス混合モデルベースの重み付けメカニズムを採用します。これは、AdaCOSA を介して取得された相関とシームレスに統合され、非同期ドリフトを効果的に処理します。
このアプローチにより、ターゲット ストリームの予測パフォーマンスと安定性が大幅に向上します。
私たちは、さまざまなドリフト シナリオとタイプを網羅する、いくつかの合成データ ストリームと現実世界のデータ ストリームに対して包括的な実験を実施します。
この結果は、OBAL が複数の情報源から得られた肯定的な知識を効果的に活用することにより、マルチストリーム分類問題への対処において目覚ましい進歩を遂げていることを明確に示しています。

要約(オリジナル)

Multistream classification poses significant challenges due to the necessity for rapid adaptation in dynamic streaming processes with concept drift. Despite the growing research outcomes in this area, there has been a notable oversight regarding the temporal dynamic relationships between these streams, leading to the issue of negative transfer arising from irrelevant data. In this paper, we propose a novel Online Boosting Adaptive Learning (OBAL) method that effectively addresses this limitation by adaptively learning the dynamic correlation among different streams. Specifically, OBAL operates in a dual-phase mechanism, in the first of which we design an Adaptive COvariate Shift Adaptation (AdaCOSA) algorithm to construct an initialized ensemble model using archived data from various source streams, thus mitigating the covariate shift while learning the dynamic correlations via an adaptive re-weighting strategy. During the online process, we employ a Gaussian Mixture Model-based weighting mechanism, which is seamlessly integrated with the acquired correlations via AdaCOSA to effectively handle asynchronous drift. This approach significantly improves the predictive performance and stability of the target stream. We conduct comprehensive experiments on several synthetic and real-world data streams, encompassing various drifting scenarios and types. The results clearly demonstrate that OBAL achieves remarkable advancements in addressing multistream classification problems by effectively leveraging positive knowledge derived from multiple sources.

arxiv情報

著者 En Yu,Jie Lu,Bin Zhang,Guangquan Zhang
発行日 2024-01-01 09:39:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク