An Evaluation of Machine Learning Approaches for Early Diagnosis of Autism Spectrum Disorder

要約

自閉症スペクトラム障害 (ASD) は、社会的交流、コミュニケーション、反復的な活動の困難を特徴とする神経疾患です。
その主な起源は遺伝学にありますが、早期発見が重要であり、機械学習を活用することで、より迅速で費用対効果の高い診断を実現する有望な手段が提供されます。
この研究では、診断プロセスの強化と自動化を目的として、重要な ASD 特性を特定するために多様な機械学習手法を採用しています。
私たちは、ASD 検出におけるその有効性を判断するために 8 つの最先端の分類モデルを研究しています。
これらのバイナリ データセットに最適な分類子を見つけるために、精度、精度、再現率、特異性、F1 スコア、曲線下面積 (AUC)、カッパ、および対数損失メトリクスを使用してモデルを評価します。
すべての分類モデルの中で、子供データセットの場合は SVM モデルと LR モデルが 100% の最高精度を達成し、成人データセットの場合は LR モデルが 97.14% の最高精度を実現します。
私たちが提案する ANN モデルは、ハイパーパラメーターがモデルごとに正確に調整されている場合、新しい結合データセットに対して 94.24% という最高の精度を提供します。
ほとんどすべての分類モデルは真のラベルを利用して高い精度を達成しているため、真のラベルのないシナリオでのモデルの動作を理解するために、5 つの一般的なクラスタリング アルゴリズムを詳しく調べることに興味があります。
正規化相互情報量 (NMI)、調整済みランド指数 (ARI)、およびシルエット係数 (SC) メトリクスを計算して、最適なクラスタリング モデルを選択します。
私たちの評価では、スペクトル クラスタリングが、NMI および ARI メトリクスの点で他のすべてのベンチマーク クラスタリング モデルよりも優れていると同時に、k 平均法によって達成される最適な SC との同等性を実証していることがわかりました。
実装されたコードは GitHub で入手できます。

要約(オリジナル)

Autistic Spectrum Disorder (ASD) is a neurological disease characterized by difficulties with social interaction, communication, and repetitive activities. While its primary origin lies in genetics, early detection is crucial, and leveraging machine learning offers a promising avenue for a faster and more cost-effective diagnosis. This study employs diverse machine learning methods to identify crucial ASD traits, aiming to enhance and automate the diagnostic process. We study eight state-of-the-art classification models to determine their effectiveness in ASD detection. We evaluate the models using accuracy, precision, recall, specificity, F1-score, area under the curve (AUC), kappa, and log loss metrics to find the best classifier for these binary datasets. Among all the classification models, for the children dataset, the SVM and LR models achieve the highest accuracy of 100% and for the adult dataset, the LR model produces the highest accuracy of 97.14%. Our proposed ANN model provides the highest accuracy of 94.24% for the new combined dataset when hyperparameters are precisely tuned for each model. As almost all classification models achieve high accuracy which utilize true labels, we become interested in delving into five popular clustering algorithms to understand model behavior in scenarios without true labels. We calculate Normalized Mutual Information (NMI), Adjusted Rand Index (ARI), and Silhouette Coefficient (SC) metrics to select the best clustering models. Our evaluation finds that spectral clustering outperforms all other benchmarking clustering models in terms of NMI and ARI metrics while demonstrating comparability to the optimal SC achieved by k-means. The implemented code is available at GitHub.

arxiv情報

著者 Rownak Ara Rasul,Promy Saha,Diponkor Bala,S M Rakib Ul Karim,Md. Ibrahim Abdullah,Bishwajit Saha
発行日 2023-12-28 14:16:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク