要約
Health Nection Classification(HMC)は、リアルタイム追跡と公衆衛生監視のためのソーシャルメディアの投稿を活用する上で重要な役割を果たしています。
それにもかかわらず、HMCのプロセスは、個人の病気を明示的に反映するのではなく、比fig的な言語や記述用語などの健康言語の文脈的側面に起因する、その複雑な性質のために重要な課題を提示します。
この問題に対処するために、生物医学の自然言語法(NLP)の強化されたパラメーターを使用した従来の微調整を通じて、より明確な言及を達成できると主張します。
この研究では、スピーチ(POS)タガー情報の利用、PEFTテクニックの改善、そのような組み合わせなど、さまざまな手法を調査します。
広く使用されている3つのデータセット、RHDM、PHM、および病気で広範な実験が行われます。
結果にはPOSタガー情報が組み込まれ、PEFTテクニックを活用すると、小規模なモデルと効率的なトレーニングを利用することにより、3つのデータセットすべてにわたって最先端の方法と比較して、F1スコアの観点からパフォーマンスが大幅に向上します。
さらに、調査結果は、POSタガー情報を組み込み、HMCのPEFT技術を活用することの有効性を強調しています。
結論として、提案された方法論は、モデルのサイズとトレーニング効率を最適化しながら、ソーシャルメディアの投稿での健康の言及を正確に分類するための潜在的に効果的なアプローチを提示します。
要約(オリジナル)
Health Mention Classification (HMC) plays a critical role in leveraging social media posts for real-time tracking and public health monitoring. Nevertheless, the process of HMC presents significant challenges due to its intricate nature, primarily stemming from the contextual aspects of health mentions, such as figurative language and descriptive terminology, rather than explicitly reflecting a personal ailment. To address this problem, we argue that clearer mentions can be achieved through conventional fine-tuning with enhanced parameters of biomedical natural language methods (NLP). In this study, we explore different techniques such as the utilisation of part-of-speech (POS) tagger information, improving on PEFT techniques, and different combinations thereof. Extensive experiments are conducted on three widely used datasets: RHDM, PHM, and Illness. The results incorporated POS tagger information, and leveraging PEFT techniques significantly improves performance in terms of F1-score compared to state-of-the-art methods across all three datasets by utilising smaller models and efficient training. Furthermore, the findings highlight the effectiveness of incorporating POS tagger information and leveraging PEFT techniques for HMC. In conclusion, the proposed methodology presents a potentially effective approach to accurately classifying health mentions in social media posts while optimising the model size and training efficiency.
arxiv情報
著者 | Reem Abdel-Salam,Mary Adewunmi |
発行日 | 2025-04-30 14:21:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google