Interpretable Style Takagi-Sugeno-Kang Fuzzy Clustering

要約

クラスタリングは、データの潜在的な知識を調査するための効率的で不可欠な手法です。
ただし、ほとんどのクラスタリングアルゴリズムによって検出されたクラスターの解釈可能性には限られた注意が払われています。
さらに、データの均一性により、さまざまなグループのグループには独自の均一なスタイルがあります。
このホワイトペーパーでは、上記の2つの側面を考慮し、解釈可能なスタイルのタカギーノカン(TSK)ファジークラスタリング(IS-TSK-FC)アルゴリズムが提案されています。
IS-TSK-FCのクラスタリング動作は、ファジールールのTSKファジー推論によって完全に導かれます。
特に、サンプルは、監視されていない方法で学習したすべてのファジールールの対応する結果のベクトルによって表されるクラスターにグループ化されます。
これにより、クラスターがどのように詳細に生成されるかを説明することができ、IS-TSK-FCの基礎となる意思決定プロセスを解釈可能にします。
さらに、一連のスタイルマトリックスが導入され、クラスターのスタイルと異なるスタイル間のニュアンスをキャプチャすることにより、IS-TSK-FCのファジールールの結果を促進します。
その結果、IS-TSK-FCのすべてのファジールールには、強力なデータ表現機能があります。
すべてのファジールールの前件を決定した後、IS-TSK-FCの最適化問題は、代替方法で繰り返し解決できます。
解釈可能なクラスタリングツールとしてのIS-TSK-FCの有効性は、不明な暗黙的/明示的なスタイルを備えたベンチマークデータセットでの広範な実験を通じて検証されます。
特に、IS-TSK-FCの優れたクラスタリングパフォーマンスは、さまざまなデータグループが明示的なスタイルを示しているケーススタディで実証されています。
IS-TSK-FCのソースコードは、https://github.com/gusuhang10/is-tsk-fcからダウンロードできます。

要約(オリジナル)

Clustering is an efficient and essential technique for exploring latent knowledge of data. However, limited attention has been given to the interpretability of the clusters detected by most clustering algorithms. In addition, due to the homogeneity of data, different groups of data have their own homogeneous styles. In this paper, the above two aspects are considered, and an interpretable style Takagi-Sugeno-Kang (TSK) fuzzy clustering (IS-TSK-FC) algorithm is proposed. The clustering behavior of IS-TSK-FC is fully guided by the TSK fuzzy inference on fuzzy rules. In particular, samples are grouped into clusters represented by the corresponding consequent vectors of all fuzzy rules learned in an unsupervised manner. This can explain how the clusters are generated in detail, thus making the underlying decision-making process of the IS-TSK-FC interpretable. Moreover, a series of style matrices are introduced to facilitate the consequents of fuzzy rules in IS-TSK-FC by capturing the styles of clusters as well as the nuances between different styles. Consequently, all the fuzzy rules in IS-TSK-FC have powerful data representation capability. After determining the antecedents of all the fuzzy rules, the optimization problem of IS-TSK-FC can be iteratively solved in an alternation manner. The effectiveness of IS-TSK-FC as an interpretable clustering tool is validated through extensive experiments on benchmark datasets with unknown implicit/explicit styles. Specially, the superior clustering performance of IS-TSK-FC is demonstrated on case studies where different groups of data present explicit styles. The source code of IS-TSK-FC can be downloaded from https://github.com/gusuhang10/IS-TSK-FC.

arxiv情報

著者 Suhang Gu,Ye Wang,Yongxin Chou,Jinliang Cong,Mingli Lu,Zhuqing Jiao
発行日 2025-04-07 14:28:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク