RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations

要約

多くの場合、特徴関係に基づいたバイカルスターを見つけるための既存のバイクラスタリングアルゴリズムは、単調性や直線性などの仮定に依存します。
いくつかのアルゴリズムは密度ベースの方法を使用することでこの問題を克服しますが、密な領域を特定するためにグローバルな基準を使用するため、多くのバイクラスターを見逃す傾向があります。
提案された方法であるReldencluは、特徴の各ペアの周辺および関節密度の局所的な変動を使用して、それらの間の関係の基礎を形成する観測のサブセットを見つけます。
次に、一般的な一連の観測セットで接続された一連の機能を見つけ、その結果、バイクラスターになります。
提案された方法論の有効性を示すために、15種類のシミュレートされたデータセットで実験が行われました。
さらに、6つの実際のデータセットに適用されています。
これらの実生活の3つのデータセットでは、提案された方法は監視されていない学習に使用されますが、他の3つの実際のデータセットでは、監視された学習の援助として使用されます。
すべてのデータセットについて、提案された方法のパフォーマンスを7つの異なる最先端のアルゴリズムのパフォーマンスと比較し、提案されたアルゴリズムはより良い結果を生成することが見られます。
提案されたアルゴリズムの有効性は、Covid-19の拡散に影響を与える可能性が高いいくつかの機能(遺伝、人口統計など)を特定するためのCovid-19データセットでの使用によっても見られます。

要約(オリジナル)

The existing biclustering algorithms for finding feature relation based biclusters often depend on assumptions like monotonicity or linearity. Though a few algorithms overcome this problem by using density-based methods, they tend to miss out many biclusters because they use global criteria for identifying dense regions. The proposed method, RelDenClu uses the local variations in marginal and joint densities for each pair of features to find the subset of observations, which forms the bases of the relation between them. It then finds the set of features connected by a common set of observations, resulting in a bicluster. To show the effectiveness of the proposed methodology, experimentation has been carried out on fifteen types of simulated datasets. Further, it has been applied to six real-life datasets. For three of these real-life datasets, the proposed method is used for unsupervised learning, while for other three real-life datasets it is used as an aid to supervised learning. For all the datasets the performance of the proposed method is compared with that of seven different state-of-the-art algorithms and the proposed algorithm is seen to produce better results. The efficacy of proposed algorithm is also seen by its use on COVID-19 dataset for identifying some features (genetic, demographics and others) that are likely to affect the spread of COVID-19.

arxiv情報

著者 Namita Jain,Susmita Ghosh,C. A. Murthy
発行日 2025-03-28 17:02:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク