GBFRS: Robust Fuzzy Rough Sets via Granular-ball Computing

要約

ファジーラフセット理論は、複雑な属性を持つデータセットの処理に効果的であり、強固な数学的基盤によってサポートされ、機械学習におけるカーネルメソッドに密接にリンクされています。
ファジーラフセット理論に基づく属性削減アルゴリズムと分類器は、高次元多変量複合データの分析において有望なパフォーマンスを示します。
ただし、ほとんどの既存のモデルは最高の粒度で動作し、特に高次元のビッグデータでは、ノイズに対して非効率的で敏感になります。
したがって、ファジーラフセットモデルの堅牢性を高めることは、効果的な機能選択に重要です。
最近の開発であるMuiti-Garanularty Granular-Ballコンピューティングは、さまざまなサイズの粒状ボールを使用して、サンプルスペースを適応的に表現およびカバーし、これらの粒状ボールに基づいて学習を実行します。
このホワイトペーパーでは、マルチ粒度粒状ボールコンピューティングをファジーラフセット理論に統合することを提案し、粒状ボールを使用してサンプルポイントを置き換えることを提案しています。
粒状ボールの粗粒の特性により、モデルがより堅牢になります。
さらに、粒状ボールコンピューティングに基づいて、監視された方法全体にスケーラブルな粒状ボールを生成するための新しい方法を提案します。
依存関数を介して機能とカテゴリ間の相関を定義することにより、フォワード検索アルゴリズムを使用して機能シーケンスを選択します。
実験は、提案されているモデルの有効性とベースライン方法よりも優越性を示しています。

要約(オリジナル)

Fuzzy rough set theory is effective for processing datasets with complex attributes, supported by a solid mathematical foundation and closely linked to kernel methods in machine learning. Attribute reduction algorithms and classifiers based on fuzzy rough set theory exhibit promising performance in the analysis of high-dimensional multivariate complex data. However, most existing models operate at the finest granularity, rendering them inefficient and sensitive to noise, especially for high-dimensional big data. Thus, enhancing the robustness of fuzzy rough set models is crucial for effective feature selection. Muiti-garanularty granular-ball computing, a recent development, uses granular-balls of different sizes to adaptively represent and cover the sample space, performing learning based on these granular-balls. This paper proposes integrating multi-granularity granular-ball computing into fuzzy rough set theory, using granular-balls to replace sample points. The coarse-grained characteristics of granular-balls make the model more robust. Additionally, we propose a new method for generating granular-balls, scalable to the entire supervised method based on granular-ball computing. A forward search algorithm is used to select feature sequences by defining the correlation between features and categories through dependence functions. Experiments demonstrate the proposed model’s effectiveness and superiority over baseline methods.

arxiv情報

著者 Shuyin Xia,Xiaoyu Lian,Binbin Sang,Guoyin Wang,Xinbo Gao
発行日 2025-01-30 15:09:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク