Ensemble Framework for Cardiovascular Disease Prediction

要約

心臓病は、世界中で非伝染性の静かな死の主な原因です。
心臓病または心血管疾患は、冠状動脈性心疾患、心不全、先天性心疾患、心筋症の 4 つのタイプに分類されます。
さらなる傷害を避け、患者の命を救うためには、心臓病を早期かつ正確に診断することが極めて重要です。
そのため、心血管疾患が危機的な状況になる前に予測できるシステムが必要です。
機械学習は、医学分野の研究者の関心を集めています。
心臓病を予測するために、研究者はさまざまな機械学習の方法やアプローチを実装しています。
この研究では、私たちの知る限り、心血管疾患の個人向けにオンラインで利用できる最大のデータセットの 1 つである IEEE Data Port のデータセットを使用しました。
このデータセットは、ハンガリー、クリーブランド、バージニア州ロングビーチ、スイス、Statlog データセットを組み合わせたもので、最大心拍数、血清コレステロール、胸痛の種類、空腹時血糖値などの重要な特徴が含まれています。
開発されたモデルの有効性と強度を評価するために、ROC、AUC 曲線、特異性、F1 スコア、感度、MCC、精度などのいくつかのパフォーマンス測定が使用されます。
この研究では、ExtraTrees Classifier、Random Forest、XGBoost などのいくつかの機械学習アルゴリズムを使用したスタック型アンサンブル分類器を備えたフレームワークを提案しました。
私たちが提案したフレームワークは、既存の文献よりも高い 92.34% の精度を達成しました。

要約(オリジナル)

Heart disease is the major cause of non-communicable and silent death worldwide. Heart diseases or cardiovascular diseases are classified into four types: coronary heart disease, heart failure, congenital heart disease, and cardiomyopathy. It is vital to diagnose heart disease early and accurately in order to avoid further injury and save patients’ lives. As a result, we need a system that can predict cardiovascular disease before it becomes a critical situation. Machine learning has piqued the interest of researchers in the field of medical sciences. For heart disease prediction, researchers implement a variety of machine learning methods and approaches. In this work, to the best of our knowledge, we have used the dataset from IEEE Data Port which is one of the online available largest datasets for cardiovascular diseases individuals. The dataset isa combination of Hungarian, Cleveland, Long Beach VA, Switzerland & Statlog datasets with important features such as Maximum Heart Rate Achieved, Serum Cholesterol, Chest Pain Type, Fasting blood sugar, and so on. To assess the efficacy and strength of the developed model, several performance measures are used, such as ROC, AUC curve, specificity, F1-score, sensitivity, MCC, and accuracy. In this study, we have proposed a framework with a stacked ensemble classifier using several machine learning algorithms including ExtraTrees Classifier, Random Forest, XGBoost, and so on. Our proposed framework attained an accuracy of 92.34% which is higher than the existing literature.

arxiv情報

著者 Achyut Tiwari,Aryan Chugh,Aman Sharma
発行日 2023-06-16 17:37:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク