要約
小児期のワクチン接種は公衆衛生の礎石ですが、ワクチン接種の範囲の格差はイギリス全土で続いています。
これらの格差は、地理的、人口統計学的、社会経済的、文化的(GDSC)要因など、さまざまな要因間の複雑な相互作用によって形作られます。
以前の研究は、主に断面データと、個々のまたは限られた変数セットを単独で評価する従来の統計的アプローチに依存しています。
このような方法は、ワクチンの取り込みの動的で多変量性の性質を捉えるのに不十分な場合があります。
この論文では、2021年から2024年までイギリスの150の地区で小児期の予防接種の縦方向の機械学習分析を実施しました。NHSレコードからのワクチン接種データを使用して、ワクチン接種のカバレッジにより階層的クラスタリングを適用しました。
次に、GDSCデータを使用して地区のワクチン接種クラスターを予測するように訓練されました。
最後に、Shapley Additive説明(SHAP)メソッドを使用して、予測因子の重要性を解釈しました。
分類器は、2021-2022、2022-2023、および2023-2024のそれぞれの地区の予防接種クラスターの予測において、92.1、90.6、および86.3の高い精度を達成しました。
Shapは、地理的、文化的、および人口統計学的変数、特に農業、英語能力、外国生まれの住民の割合、および民族構成が予防接種のカバレッジの最も影響力のある予測因子であるのに対し、剥奪や雇用などの社会経済的変数は、特に2023-2024で一貫して重要性を示したことを明らかにしました。
驚くべきことに、農村地区は予防接種率が高くなる可能性が非常に高かった。
さらに、予防接種が低い地区には、第一言語が英語ではなく、英国外で生まれた、または少数民族のグループから来た人口が高くなりました。
要約(オリジナル)
Childhood vaccination is a cornerstone of public health, yet disparities in vaccination coverage persist across England. These disparities are shaped by complex interactions among various factors, including geographic, demographic, socioeconomic, and cultural (GDSC) factors. Previous studies mostly rely on cross-sectional data and traditional statistical approaches that assess individual or limited sets of variables in isolation. Such methods may fall short in capturing the dynamic and multivariate nature of vaccine uptake. In this paper, we conducted a longitudinal machine learning analysis of childhood vaccination coverage across 150 districts in England from 2021 to 2024. Using vaccination data from NHS records, we applied hierarchical clustering to group districts by vaccination coverage into low- and high-coverage clusters. A CatBoost classifier was then trained to predict districts’ vaccination clusters using their GDSC data. Finally, the SHapley Additive exPlanations (SHAP) method was used to interpret the predictors’ importance. The classifier achieved high accuracies of 92.1, 90.6, and 86.3 in predicting districts’ vaccination clusters for the years 2021-2022, 2022-2023, and 2023-2024, respectively. SHAP revealed that geographic, cultural, and demographic variables, particularly rurality, English language proficiency, the percentage of foreign-born residents, and ethnic composition, were the most influential predictors of vaccination coverage, whereas socioeconomic variables, such as deprivation and employment, consistently showed lower importance, especially in 2023-2024. Surprisingly, rural districts were significantly more likely to have higher vaccination rates. Additionally, districts with lower vaccination coverage had higher populations whose first language was not English, who were born outside the UK, or who were from ethnic minority groups.
arxiv情報
著者 | Amin Noroozi,Sidratul Muntaha Esha,Mansoureh Ghari |
発行日 | 2025-04-18 15:41:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google