Multi-Label Classification of COVID-Tweets Using Large Language Models

要約

ワクチン接種は、さまざまな病気のリスクと蔓延を最小限に抑えるために重要です。
近年、ワクチン接種は新型コロナウイルス感染症のパンデミックに対抗するための重要なステップとなっている。
しかし、多くの人々は、関与する政治やワクチンの潜在的な副作用など、さまざまな理由からワクチンの使用に懐疑的です。このタスクの目標は、ソーシャル メディアの投稿にラベルを付けるための効果的なマルチラベル分類子を構築することです (
投稿者が表明したワクチンに対する特定の懸念に従って、特にツイート)。
私たちは 3 つの異なるモデル (a) 教師あり BERT-large-uncased、(b) 教師あり HateXplain モデル、および (c) Zero-Shot GPT-3.5 Turbo モデルを試しました。
このケースでは、教師あり BERT-large-uncased モデルが最も優れたパフォーマンスを発揮しました。
マクロ F1 スコア 0.66、Jaccard 類似性スコア 0.66 を達成し、他の応募作品の中で 6 位を獲得しました。
コードはhttps://github.com/anonmous1981/AISOMEから入手できます。

要約(オリジナル)

Vaccination is important to minimize the risk and spread of various diseases. In recent years, vaccination has been a key step in countering the COVID-19 pandemic. However, many people are skeptical about the use of vaccines for various reasons, including the politics involved, the potential side effects of vaccines, etc. The goal in this task is to build an effective multi-label classifier to label a social media post (particularly, a tweet) according to the specific concern(s) towards vaccines as expressed by the author of the post. We tried three different models-(a) Supervised BERT-large-uncased, (b) Supervised HateXplain model, and (c) Zero-Shot GPT-3.5 Turbo model. The Supervised BERT-large-uncased model performed best in our case. We achieved a macro-F1 score of 0.66, a Jaccard similarity score of 0.66, and received the sixth rank among other submissions. Code is available at-https://github.com/anonmous1981/AISOME

arxiv情報

著者 Aniket Deroy,Subhankar Maity
発行日 2023-12-17 15:50:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SI パーマリンク