要約
自然災害が発生した際、人々は、助けを求めたり、災害状況に関する情報を提供したり、進行中の出来事や公共政策やガイドラインに対する軽蔑を表明したりするために、Twitter などのソーシャル メディア プラットフォームをよく使用します。
この軽蔑は、場合によっては皮肉や皮肉として表現されます。
災害を中心とした文脈でこの音声形式を理解することは、災害関連ツイートの自然言語理解を向上させるために不可欠です。
この論文では、意図された皮肉について注釈が付けられた 15,000 件のツイートのデータセットである HurricaneSARC を紹介し、事前トレーニングされた言語モデルを使用した皮肉検出の包括的な調査を提供します。
私たちの最良のモデルは、データセット上で 0.70 F1 もの値を取得できます。
また、中間タスク転送学習を活用することで HurricaneSARC のパフォーマンスを向上できることも示します。
データとコードは https://github.com/tsosea2/HurricaneSarc でリリースされています。
要約(オリジナル)
During natural disasters, people often use social media platforms such as Twitter to ask for help, to provide information about the disaster situation, or to express contempt about the unfolding event or public policies and guidelines. This contempt is in some cases expressed as sarcasm or irony. Understanding this form of speech in a disaster-centric context is essential to improving natural language understanding of disaster-related tweets. In this paper, we introduce HurricaneSARC, a dataset of 15,000 tweets annotated for intended sarcasm, and provide a comprehensive investigation of sarcasm detection using pre-trained language models. Our best model is able to obtain as much as 0.70 F1 on our dataset. We also demonstrate that the performance on HurricaneSARC can be improved by leveraging intermediate task transfer learning. We release our data and code at https://github.com/tsosea2/HurricaneSarc.
arxiv情報
著者 | Tiberiu Sosea,Junyi Jessy Li,Cornelia Caragea |
発行日 | 2023-08-16 05:58:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google