MUTE-Reco: MUTual Information Assisted Ensemble Feature RECOmmender System for Healthcare Prognosis


目的: 健康推奨機能は重要な意思決定支援システムとして機能し、患者と医療専門家が患者の健康につながる行動を取るのを支援します。
方法: 8 つの一般的な特徴選択方法から得られた特徴のランクを考慮した、新しい相互情報量およびアンサンブルベースの特徴ランキング アプローチ (MUTE-Reco と呼ばれる) が提案されます。
結果: 提案された方法の有効性を確立するために、さまざまな疾患 (明細胞腎細胞癌 (ccRCC)、慢性腎臓病、インドの肝臓患者、および子宮頸癌危険因子) の 4 つのベンチマーク データセットに対して実験が実施されました。
実験結果は、推奨される機能を使用して構築されたモデルが、既存の方法と比較して、少ない機能セットで ccRCC のさまざまな段階を分類する高い精度 (サポート ベクター マシンとニューラル ネットワークを使用した場合、それぞれ 96.6% と 98.6%) を達成できることを示しています。
さらに、上位 2 つの機能は、ccRCC で提案された方法を使用することを推奨します。
腫瘍のサイズと転移の状態は、既存の TNM システムから医学的に検証されています。
結果は、他の 3 つのデータセットでも優れていることがわかります。
結論: 提案されたレコメンダー MUTE-Reco は、病気を検出する上で最も識別力のある危険因子を特定し、推奨することができます。


Purpose: Health recommenders act as important decision support systems, aiding patients and medical professionals in taking actions that lead to patients’ well-being. These systems extract the information which may be of particular relevance to the end-user, helping them in making appropriate decisions. The present study proposes a feature recommender that identifies and recommends the most important risk factors for healthcare prognosis. Methods: A novel mutual information and ensemble-based feature ranking approach (termed as, MUTE-Reco) considering the rank of features obtained from eight popular feature selection methods, is proposed. Results: To establish the effectiveness of the proposed method, the experiment has been conducted on four benchmark datasets of diverse diseases (clear cell renal cell carcinoma (ccRCC), chronic kidney disease, Indian liver patient, and cervical cancer risk factors). The performance of the proposed recommender is compared with four state-of-the-art methods using recommender systems’ performance metrics like average precision@K, precision@K, recall@K, F1@K, reciprocal rank@K. Experimental results show that the model built with the recommended features can attain a higher accuracy (96.6% and 98.6% using support vector machine and neural network, respectively) for classifying different stages of ccRCC with a reduced feature set as compared to existing methods. Moreover, the top two features recommended using the proposed method with ccRCC, viz. size of tumor and metastasis status, are medically validated from the existing TNM system. Results are also found to be superior for the other three datasets. Conclusion: The proposed recommender, MUTE-Reco, can identify and recommend risk factors that have the most discriminating power for detecting diseases.


著者 Abhishek Dey,Debayan Goswami,Rahul Roy,Susmita Ghosh,Yu Shrike Zhang,Jonathan H. Chan
発行日 2024-04-30 14:01:44+00:00
