要約
特にマルチクラス分類タスクでは、適応ブースト(ADABOOST)は、ラベルノイズによってもたらされる重大な課題に直面しています。
既存の方法は、ラベルノイズを効果的に処理するメカニズムを欠いているか、冗長なデータ使用による高い計算コストに苦しむかのいずれかです。
粒状コンピューティングに触発されたこのペーパーでは、騒々しい条件下での効率と堅牢性を高めるために、データ顆粒段階と適応ブースト段階を含む新しい2段階のフレームワークである粒状適応ブースト(Gadaboost)を提案します。
その実現可能性を検証するために、gadabooost.saと呼ばれるsammeの拡張が提案されています。
具体的には、最初に、粒状ボール生成法は、多様性を維持し、ラベルノイズを緩和しながらデータを圧縮するように設計されています。
第二に、粒状ボールベースのSammeアルゴリズムは、個々のサンプルではなく粒状ボールに焦点を当てており、効率を改善し、騒音に対する感度を低下させます。
いくつかの騒々しいデータセットでの実験結果は、提案されたアプローチが既存の方法と比較して優れた堅牢性と効率を達成することを示しており、この作業がアダボーストとSammeを効果的に拡大することを示しています。
要約(オリジナル)
Adaptive Boosting (AdaBoost) faces significant challenges posed by label noise, especially in multiclass classification tasks. Existing methods either lack mechanisms to handle label noise effectively or suffer from high computational costs due to redundant data usage. Inspired by granular computing, this paper proposes granular adaptive boosting (GAdaBoost), a novel two-stage framework comprising a data granulation stage and an adaptive boosting stage, to enhance efficiency and robustness under noisy conditions. To validate its feasibility, an extension of SAMME, termed GAdaBoost.SA, is proposed. Specifically, first, a granular-ball generation method is designed to compress data while preserving diversity and mitigating label noise. Second, the granular ball-based SAMME algorithm focuses on granular balls rather than individual samples, improving efficiency and reducing sensitivity to noise. Experimental results on some noisy datasets show that the proposed approach achieves superior robustness and efficiency compared with existing methods, demonstrating that this work effectively extends AdaBoost and SAMME.
arxiv情報
著者 | Qin Xie,Qinghua Zhang,Shuyin Xia,Xinran Zhou,Guoyin Wang |
発行日 | 2025-06-17 14:21:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google