First Experiences with the Identification of People at Risk for Diabetes in Argentina using Machine Learning Techniques

要約

2 型糖尿病 (T2D) および前糖尿病 (PD) を検出することは、病原性症状がなく、関連する既知の危険因子が不足しているため、医学にとって真の課題です。
機械学習モデルの提案の中には、リスクにさらされている人々を特定できるものもありますが、状況の性質上、ある集団に適したモデルが別の集団にも必ずしも適しているとは限りません。
この記事では、特にアルゼンチンにおける T2D および PD のリスクのある人々を特定するための予測モデルの開発と評価について説明します。
まず、データベースが徹底的に前処理され、レコード数と利用可能な変数の量の間の妥協点を考慮して 3 つの特定のデータセットが生成されました。
5 つの異なる分類モデルを適用した後に得られた結果は、これらのモデルの一部を使用した 2 つのデータセットで非常に優れたパフォーマンスが観察されたことを示しています。
特に、RF、DT、および ANN は優れた分類能力を示し、検討対象のメトリクスに対して良好な値を示しました。
アルゼンチンにはこの種のツールが不足しているため、この作業はより洗練されたモデルの開発に向けた第一歩となります。

要約(オリジナル)

Detecting Type 2 Diabetes (T2D) and Prediabetes (PD) is a real challenge for medicine due to the absence of pathogenic symptoms and the lack of known associated risk factors. Even though some proposals for machine learning models enable the identification of people at risk, the nature of the condition makes it so that a model suitable for one population may not necessarily be suitable for another. In this article, the development and assessment of predictive models to identify people at risk for T2D and PD specifically in Argentina are discussed. First, the database was thoroughly preprocessed and three specific datasets were generated considering a compromise between the number of records and the amount of available variables. After applying 5 different classification models, the results obtained show that a very good performance was observed for two datasets with some of these models. In particular, RF, DT, and ANN demonstrated great classification power, with good values for the metrics under consideration. Given the lack of this type of tool in Argentina, this work represents the first step towards the development of more sophisticated models.

arxiv情報

著者 Enzo Rucci,Gonzalo Tittarelli,Franco Ronchetti,Jorge F. Elgart,Laura Lanzarini,Juan José Gagliardino
発行日 2024-03-27 14:38:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク