Unified dimensionality reduction techniques in chronic liver disease detection

要約

世界的に、慢性肝疾患は依然として大きな健康上の懸念であり、迅速な検出と治療のための正確な予測モデルが必要です。
この研究では、カリフォルニア大学アーバイン校の UCI 機械学習リポジトリのインド肝患者データセット (ILPD) を使用して、多数の機械学習アルゴリズムが調査されています。
私たちの研究の主な焦点は、583 人の患者の医療記録を含むこのデータセットであり、そのうち 416 人は肝疾患と診断され、167 人は肝疾患と診断されていません。
この作業には、線形判別分析 (LDA)、因子分析 (FA)、t 分布確率的近傍埋め込み (t-SNE)、均一多様体近似投影 (UMAP) などの特徴抽出および次元削減手法を含む、いくつかの側面があります。

研究の目的は、これらのアプローチが高次元データセットの変換と予測精度の向上にどの程度うまく機能するかを調査することです。
改良されたモデルの予測能力を評価するために、多層パーセプトロン、ランダム フォレスト、K 最近傍法、ロジスティック回帰などの多くの分類方法が使用されました。
注目すべきことに、改良されたモデルは見事にパフォーマンスを発揮し、ランダム フォレストは 10 分割相互検証で 98.31\%、トレインテスト分割評価で 95.79\% という最高の精度を示しました。
調査結果は、慢性肝疾患患者の予測モデルを改善する、カスタマイズされた特徴抽出および次元削減方法の選択と使用に関する重要な新しい視点を提供します。

要約(オリジナル)

Globally, chronic liver disease continues to be a major health concern that requires precise predictive models for prompt detection and treatment. Using the Indian Liver Patient Dataset (ILPD) from the University of California at Irvine’s UCI Machine Learning Repository, a number of machine learning algorithms are investigated in this study. The main focus of our research is this dataset, which includes the medical records of 583 patients, 416 of whom have been diagnosed with liver disease and 167 of whom have not. There are several aspects to this work, including feature extraction and dimensionality reduction methods like Linear Discriminant Analysis (LDA), Factor Analysis (FA), t-distributed Stochastic Neighbour Embedding (t-SNE), and Uniform Manifold Approximation and Projection (UMAP). The purpose of the study is to investigate how well these approaches work for converting high-dimensional datasets and improving prediction accuracy. To assess the prediction ability of the improved models, a number of classification methods were used, such as Multi-layer Perceptron, Random Forest, K-nearest neighbours, and Logistic Regression. Remarkably, the improved models performed admirably, with Random Forest having the highest accuracy of 98.31\% in 10-fold cross-validation and 95.79\% in train-test split evaluation. Findings offer important new perspectives on the choice and use of customized feature extraction and dimensionality reduction methods, which improve predictive models for patients with chronic liver disease.

arxiv情報

著者 Anand Karna,Naina Khan,Rahul Rauniyar,Prashant Giridhar Shambharkar
発行日 2024-12-30 18:35:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク