Accelerated Fuzzy C-Means Clustering Based on New Affinity Filtering and Membership Scaling

要約

Fuzzy C-Means (FCM) は、広く使用されているクラスタリング手法です。
ただし、FCM とその多くの高速化されたバリアントは、クラスタリング プロセスの中期から後期の段階で効率が低くなります。
この段階では、すべてのサンプルがそれらの非親和性中心の更新に関与し、割り当てが変更されていないほとんどのサンプルのファジー メンバーシップ グレードは、サンプル-中心距離を計算することによって更新されます。
これらはすべて、アルゴリズムの収束が遅くなることにつながります。
この論文では、少ない計算量で各サンプルの非親和性中心の完全なセットを認識するために、新しい親和性フィルタリング手法が開発されました。
次に、各サンプルとその非親和性センター間のメンバーシップ グレードを 0 に設定し、他のサンプルのファジー メンバーシップ グレードを維持するための新しいメンバーシップ スケーリング手法が提案されています。
これら 2 つの手法を統合することにより、新しいアフィニティ フィルタリングとメンバーシップ スケーリング (AMFCM) に基づく FCM が提案され、FCM の収束プロセス全体が加速されます。
合成および実世界のデータセットに対して実行された多くの実験結果は、提案されたアルゴリズムの実現可能性と効率を示しています。
最先端のアルゴリズムと比較して、AMFCM は大幅に高速で効果的です。
たとえば、AMFCM は FCM の反復回数を平均で 80% 削減します。

要約(オリジナル)

Fuzzy C-Means (FCM) is a widely used clustering method. However, FCM and its many accelerated variants have low efficiency in the mid-to-late stage of the clustering process. In this stage, all samples are involved in the update of their non-affinity centers, and the fuzzy membership grades of the most of samples, whose assignment is unchanged, are still updated by calculating the samples-centers distances. All those lead to the algorithms converging slowly. In this paper, a new affinity filtering technique is developed to recognize a complete set of the non-affinity centers for each sample with low computations. Then, a new membership scaling technique is suggested to set the membership grades between each sample and its non-affinity centers to 0 and maintain the fuzzy membership grades for others. By integrating those two techniques, FCM based on new affinity filtering and membership scaling (AMFCM) is proposed to accelerate the whole convergence process of FCM. Many experimental results performed on synthetic and real-world data sets have shown the feasibility and efficiency of the proposed algorithm. Compared with the state-of-the-art algorithms, AMFCM is significantly faster and more effective. For example, AMFCM reduces the number of the iteration of FCM by 80% on average.

arxiv情報

著者 Dong Li,Shuisheng Zhou,Witold Pedrycz
発行日 2023-02-14 14:20:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク